中國人工智能開源模型橫空出世 印媒:美國的限制失效了分享到:
香港新聞網1月3日電 2024年末,刷屏的中國技術成果不僅僅是“六代機”,還有人工智能(AI)模型DeepSeek-V3。這款語言模型不僅在性能上媲美西方頂級閉源模型,其低成本高效能的特點更是引發海內外AI業界的高度關注。有美國媒體表示,OpenAI、谷歌等行業巨頭的主導地位將面臨挑戰。 DeepSeek官方網站截圖 總部位於杭州的DeepSeek日前發佈了全新系列模型DeepSeek-V3首個版本,并同步開源。據了解,DeepSeek-V3在多項基準測試中超越了Meta開發的Llama-3.1,并在性能上與OpenAI開發的閉源模型GPT-4o不分伯仲。 值得注意的是,在較高性價比的訓練架構下,DeepSeek-V3的訓練成本僅為560萬美元,訓練時長只有兩個月,遠低於OpenAI模型GPT-4o愈1億美元的成本及三個月的訓練時長。 技術突破、性能優越、低成本……被冠以“AI界高效低價典範”的DeepSeek-V3迅速爆火,AI賽道上崛起的這股中國創新勢力在海內外掀起了廣泛熱議。 美國CNBC報道指,DeepSeek-V3的重要性體現在,谷歌、OpenAI等AI巨頭迄今為止耗費了數十億美元和大量時間來建立新的語言模型,但中國的DeepSeek帶來了另一個可能性——低成本高效能。 CNBC稱,DeepSeek這種具有競爭力的AI企業的出現,將使AI開發的進入壁壘降低,OpenAI、谷歌、Meta等在行業中的主導地位將面臨挑戰。 美國科技媒體Tom’s Hardware報道指,DeepSeek-V3的出現表明,儘管美國的制裁導致中國獲取硬件受限,但聰明的中國科技從業者正努力從有限的硬件裡提取最大性能。DeepSeek的成就表明,使用相對有限的資源訓練高級混合專家(MoE)模型的語言模型這一做法具有可行性。 《印度快報》評論道,隨著DeepSeek-V3這一技術創新成果的出現,美國對華芯片出口限制或許不如預期那般有效。 《分析印度》則指,考慮到DeepSeek-V3的高性能,美國過去幾年對華制裁似乎產生了反效果,獲取硬件的難度增大導致中國高度重視模型架構層面的優化。 該媒體還提到,DeepSeek-V3的出現還在社媒平台上引發了一些猜想,即如果一開始獲取芯片沒有受限,中國AI技術會到達何種程度。(編譯:李雪萍) 【編輯:李雪萍】
|