阿里通義千問發布最新推理模型股價大漲 | 內地 - 香港中通社

2025年05月11日星期日繁简

首頁 -> 內地

阿里通義千問發布最新推理模型股價大漲

分享到：

分享到微信

分享到微博

分享到Twitter

分享到Facebook

分享到QQ

2025-03-06 18:25 | 稿件來源：香港中通社

【字號：大中小】

香港中通社3月6日電中國阿里巴巴集團旗下通義千問大模型團隊6日宣布，正式推出最新的推理模型QwQ-32B。據通義千問大模型團隊介紹，這是一款擁有320億參數的模型，其性能可與具備6710億參數（其中370億被激活）的DeepSeek-R1媲美。

圖為阿里巴巴集團總部——杭州西溪園區內一角。新華網資料圖

在數學推理、編程能力和通用能力的一系列基準測試中，通義千問大模型團隊將QwQ-32B與美國科企OpenAI的o1-mini以及中國科企DeepSeek滿血版及蒸餾版進行了比較，結果顯示，在測試數學能力的AIME24評測集上，以及評估代碼能力的LiveCodeBench中，QwQ-32B表現與DeepSeek-R1相當，遠勝於o1-mini及相同尺寸的R1蒸餾模型。

至於為何能夠實現這一點，奧秘仍在於大規模強化學習的方法。據介紹，在冷啟動基礎上，阿里通義團隊針對數學和編程任務、通用能力分別進行了兩輪大規模強化學習。在初始階段，特別針對數學和編程任務進行了強化學習訓練。與依賴傳統的獎勵模型不同，通義千問大模型團隊通過校驗生成答案的正確性來為數學問題提供反饋，並通過代碼執行服務器評估生成的代碼是否成功通過測試用例來提供代碼的反饋。

目前，阿里已採用寬鬆的Apache2.0協議，將QwQ-32B模型向全球開源。

QwQ-32B面世後，6日，阿里巴巴港股股價升逾8%。

2月底，阿里剛宣布全面開源旗下視頻生成模型萬相2.1模型。1月底，阿里通義千問宣布開源兩款大模型Qwen2.5-VL和Qwen2.5-1M。（完）

【編輯：馬華】

相關新聞

中國阿里巴巴推全模态AI模型　可處理音頻視頻及手機上用

Manus橫空出世！台輿論：對普通人更適用，說明大陸不止DeepSeek

中國AI開源模型推動全球共享智能紅利

DeepSeek-R1多芯片版本開源

AI競爭愈發激烈：馬斯克剛發佈Grok 3，DeepSeek跟著發重磅論文

性能超過Deepseek！蘋果選擇阿里巴巴合作開發AI功能

DeepSeek到底什麼水平？

專訪AI專家：資金是香港“DeepSeek級”大模型的東風

華為騰訊阿里百度等上線DeepSeek大模型

DeepSeek異軍突起　中國AI大爆發

中國DeepSeek橫空出世，外媒讚其“震動硅谷”

中國新AI大模型DeepSeek登頂美國APP排行榜

視頻

更多

首張黑洞照片的背後　有一位從香港走出的天文學家

【通說環球】關稅戰打不下去了？美國急邀中國談判　雙方能否達成共識？

廉政公署展覽廳“科技感十足”　廉政專員：打造成香港獨特的文化景點

2025長洲飘色巡游看呆外國遊客！哪吒成最熱門角色

2025“包山王”“包山后”誕生！三度封后的“包山后”竟也會被對手“迷惑”險失誤？

享年107歲　台灣統派精神領袖許歷農離世

【通講壇】“胡連會”20年　兩岸還有和平的未來嗎？

來論

更多

論壇

更多

圖集

更多

台灣鹿港老街濃濃的懷舊風情

深圳錦綉中華周末邀護士暨家人暖心暢游

香港數碼港低空經濟展覽開幕

閱讀排行

友情鏈接

關於我們

Copyright © 2009-2023 All Rights Reserved 香港中國通訊社有限公司版權所有

承印人：香港中國通訊社有限公司

承印地址: 香港南區黃竹坑道21號環匯廣場30樓

Tel: (+852) 28561919 Fax: (+852) 25647453