中國大模型DeepSeek為何會讓Meta恐慌？

首頁 -> 頭條

中國大模型DeepSeek為何會讓Meta恐慌？

分享到：

2025-01-27 00:00 | 稿件來源：香港新聞網

【字號：大中小】

香港新聞網1月27日電截至今天（27日）早上，國產AI Deepseek在中国和美国区苹果App Store免费榜上一路從第六位飆升至第一位。超越ChatGPT及Meta公司旗下的社交媒體平台Threads，Google Gemini、Microsoft Copilot等美國科技公司的生成式AI產品。DeepSeek現象引發美國各大媒體爭相報道。

DeepSeek引人關注的另一個原因是， DeepSeek是 “僅用不到600萬美元訓練預算”出的大模型，成本之低僅是Meta部門裡一個高管的薪資。

這款發佈不到一個月的大模型到底是什麼？

據網站公開資料顯示，中國 AI 大模型創業公司DeepSeek（深度求索）發佈的 DeepSeek-R1大模型，稱在數學、代碼、自然語言推理等任務上，性能比肩OpenAI o1正式版。

事件的起因是美股投資網出現的一則消息，一位Meta的工程師在美國科技公司員工社區Blind中這樣寫道，“Meta的生成式AI部門正處於恐慌中。

“一切源於DeepSeek-V3的出現，它在基準測試中已經讓Llama 4相形見絀。更讓人難堪的是，一家‘僅用550萬美元訓練預算的中國公司’就做到了這一點。

工程師們正在爭分奪秒地分析DeepSeek，試圖複製其中的一切可能技術。這絕非誇張。

管理層正為GenAI研發部門的巨額投入而發愁。當部門裡一個高管的薪資就超過訓練整個DeepSeek V3的成本，而且這樣的高管還有數十位，他們該如何向高層交代？

DeepSeek-R1的出現讓情況更加嚴峻。具體細節屬於機密，不便透露，不過很快就會公開了。”‘

紐約時報中文網報道，據美國人工智能公司一直使用的行業基準測試，DeepSeek聊天機器人能回答問題、解決邏輯問題，并編寫自己的計算機程序，其能力不亞於市場上已有的任何產品。而且它的造價很低，挑戰了只有最大的科技企業（它們全都在美國）才能製造出最先進的人工智能系統的普遍觀念。中國工程師稱，他們只花了約600萬美元的原始計算能力就訓練了新模型，不到科技巨頭Meta訓練其最新人工智能模型所耗資金的十分之一。

一直以來都被認為要高投入才能完成的高端技術目前卻被這家企業突破，這消息比產品本身更引發震撼。

“有600萬美元資金的公司在數量上遠遠多於有1億美元或10億美元資金的公司，”風險投資公司Page One Ventures的投資人克里斯·尼科爾森說道，他主要投資人工智能技術。