DeepSeek發布V3模型　編程能力大幅提升 | 內地 - 香港中通社

2025年05月11日星期日繁简

首頁 -> 內地

DeepSeek發布V3模型　編程能力大幅提升

分享到：

分享到微信

分享到微博

分享到Twitter

分享到Facebook

分享到QQ

2025-03-25 17:25 | 稿件來源：香港中通社

【字號：大中小】

香港中通社3月25日電中國初創公司深度求索（DeepSeek）發布了V3模型更新，加強了模型的編程能力，顯示這家公司希望在人工智能（AI）激烈競爭中保持領先優勢。

DeepSeek 香港中通社資料圖

綜合媒體25日報道，AI開源模型DeepSeek-V3的版本更新V3-0324於北京時間3月24日深夜在AI開源平台HuggingFace上線。DeepSeek沒有為此次版本更新發布任何公告，延續了該公司的低調風格。

據悉，初代DeepSeek-V3發布於去年12月26日，這款模型自上線後便以高性價比火速“出圈”。根據官方技術披露，DeepSeek-V3模型的總訓練成本為557.6萬美元，而GPT-4o等模型的訓練成本約為1億美元。

更新後的DeepSeek-V3模型大小為641GB，參數量6850億。與V3相同，V3-0324模型採用專家混合（MoE）架構，並開源允許自由商用。

此次DeepSeek發布的V3版本更新，編程能力的優化成了最大亮點。有網民使用V3-0324模型編寫800多行代碼，全程沒有出現任何故障。

有AI研究者在X發布評測指出，V3-0324模型在所有基準測試中都取得巨大進步，可能已超越美國Anthropic的Claude Sonnet 3.5，成為最強大的非推理模型。Sonnet 3.5是當前最受認可的商業AI模型之一。（完）

【編輯：彭玉婷】

相關新聞

DeepSeek橫空出世改變AI生態系？台專家：這一註解挺有說服力

AI競爭愈發激烈：馬斯克剛發佈Grok 3，DeepSeek跟著發重磅論文

DeepSeek熱度一路“狂飆”：微信等大型科企政企不斷接入

DeepSeek大模型接入中國雲平台政務系統等促行業變革

百度智能雲千帆上架DeepSeek模型推限時免費

性能超過Deepseek！蘋果選擇阿里巴巴合作開發AI功能

DeepSeek到底什麼水平？

華為騰訊阿里百度等上線DeepSeek大模型

DeepSeek異軍突起　中國AI大爆發

中國DeepSeek橫空出世，外媒讚其“震動硅谷”

中國新AI大模型DeepSeek登頂美國APP排行榜

中國大模型DeepSeek為何會讓Meta恐慌？

視頻

更多

首張黑洞照片的背後　有一位從香港走出的天文學家

【通說環球】關稅戰打不下去了？美國急邀中國談判　雙方能否達成共識？

廉政公署展覽廳“科技感十足”　廉政專員：打造成香港獨特的文化景點

2025長洲飘色巡游看呆外國遊客！哪吒成最熱門角色

2025“包山王”“包山后”誕生！三度封后的“包山后”竟也會被對手“迷惑”險失誤？

享年107歲　台灣統派精神領袖許歷農離世

【通講壇】“胡連會”20年　兩岸還有和平的未來嗎？

來論

更多

論壇

更多

圖集

更多

台灣鹿港老街濃濃的懷舊風情

深圳錦綉中華周末邀護士暨家人暖心暢游

香港數碼港低空經濟展覽開幕

閱讀排行

友情鏈接

關於我們

Copyright © 2009-2023 All Rights Reserved 香港中國通訊社有限公司版權所有

承印人：香港中國通訊社有限公司

承印地址: 香港南區黃竹坑道21號環匯廣場30樓

Tel: (+852) 28561919 Fax: (+852) 25647453