首頁 -> 頭條

中國大模型DeepSeek為何會讓Meta恐慌?

分享到:
2025-01-27 00:00 | 稿件來源:香港新聞網

【字號:

香港新聞網1月27日電   截至今天(27日)早上,國產AI Deepseek在中国和美国区苹果App Store免费榜上一路從第六位飆升至第一位。超越ChatGPT及Meta公司旗下的社交媒體平台Threads,Google Gemini、Microsoft Copilot等美國科技公司的生成式AI產品。DeepSeek現象引發美國各大媒體爭相報道。

DeepSeek引人關注的另一個原因是, DeepSeek是 “僅用不到600萬美元訓練預算”出的大模型,成本之低僅是Meta部門裡一個高管的薪資

這款發佈不到一個月的大模型到底是什麼?

據網站公開資料顯示,中國 AI 大模型創業公司DeepSeek(深度求索)發佈的 DeepSeek-R1大模型,稱在數學、代碼、自然語言推理等任務上,性能比肩OpenAI o1正式版。

事件的起因是美股投資網出現的一則消息,一位Meta的工程師在美國科技公司員工社區Blind中這樣寫道,“Meta的生成式AI部門正處於恐慌中。

“一切源於DeepSeek-V3的出現,它在基準測試中已經讓Llama 4相形見絀。更讓人難堪的是,一家‘僅用550萬美元訓練預算的中國公司’就做到了這一點。



工程師們正在爭分奪秒地分析DeepSeek,試圖複製其中的一切可能技術。這絕非誇張。

管理層正為GenAI研發部門的巨額投入而發愁。當部門裡一個高管的薪資就超過訓練整個DeepSeek V3的成本,而且這樣的高管還有數十位,他們該如何向高層交代?

DeepSeek-R1的出現讓情況更加嚴峻。具體細節屬於機密,不便透露,不過很快就會公開了。”‘

紐約時報中文網報道,據美國人工智能公司一直使用的行業基準測試,DeepSeek聊天機器人能回答問題、解決邏輯問題,并編寫自己的計算機程序,其能力不亞於市場上已有的任何產品。而且它的造價很低,挑戰了只有最大的科技企業(它們全都在美國)才能製造出最先進的人工智能系統的普遍觀念。中國工程師稱,他們只花了約600萬美元的原始計算能力就訓練了新模型,不到科技巨頭Meta訓練其最新人工智能模型所耗資金的十分之一。

一直以來都被認為要高投入才能完成的高端技術目前卻被這家企業突破,這消息比產品本身更引發震撼。

“有600萬美元資金的公司在數量上遠遠多於有1億美元或10億美元資金的公司,”風險投資公司Page One Ventures的投資人克里斯·尼科爾森說道,他主要投資人工智能技術。

DeepSeek引發美國各大媒體爭相報道。

自從OpenAI 2022年,引發人工智能熱潮以來,許多專家和投資者曾得出結論認為,如果不投入的話,沒有公司能與行業領軍者競爭。

世界領先的人工智能公司用超級計算機來訓練它們的聊天機器人,這些超級計算機需要多達1.6萬個芯片,甚至更多。但DeepSeek的工程師卻說,他們只用了約2000個英偉達生產的專用芯片。

德國世界報知名市場評論員Holger Zschaepitz表示:“中國的DeepSeek可能代表對美國股市的最大威脅,因為該公司似乎以極低的成本構建了一個突破性的模型,并且無需使用尖端芯片。這讓人質疑投入該行業的數千億美元資本支出的實際效用。”

對中國AI產業來說,DeepSeek的出圈有更強的標桿意義。美國為了圍堵中國AI產業發展,對先進算力芯片出口進行了嚴格限制。面臨如此不利的環境,中國的創業者和創新者仍通過各種可能的方式,不斷提升自身能力,縮小了中國AI產業與美國之間的差距,DeepSeek是最新的一例。(完)


【編輯:錢林霞】

視頻

更 多
首張黑洞照片的背後 有一位從香港走出的天文學家
【通說環球】關稅戰打不下去了?美國急邀中國談判 雙方能否達成共識?
廉政公署展覽廳“科技感十足” 廉政專員:打造成香港獨特的文化景點
2025長洲飘色巡游看呆外國遊客!哪吒成最熱門角色
2025“包山王”“包山后”誕生!三度封后的“包山后”竟也會被對手“迷惑”險失誤?
享年107歲 台灣統派精神領袖許歷農離世
【通講壇】“胡連會”20年 兩岸還有和平的未來嗎?