中國首個古籍大語言模型發佈：智能作詩、精確翻譯、自動標點… | 內地 - 香港中通社

2025年05月11日星期日繁简

首頁 -> 內地

中國首個古籍大語言模型發佈：智能作詩、精確翻譯、自動標點…

分享到：

分享到微信

分享到微博

分享到Twitter

分享到Facebook

分享到QQ

2023-12-13 00:00 | 稿件來源：香港新聞網

【字號：大中小】

香港新聞網12月13日電據南京農業大學網站消息，12月2日，該校信息管理科學系王東波教授研究團隊在北京發佈“荀子”古籍大語言模型。“荀子”古籍大語言模型是在國家社科基金重大項目“中國古代典籍跨語言知識庫構建及應用研究”的支持下，聯合中華書局古聯公司推出的專門進行古籍處理與研究的智能工具。該模型包含《四庫全書》在內的絕大多數傳世古籍文獻，擁有超過20億字的大型語料庫。

“荀子”古籍大語言模型以古籍智能化研究為目的，為古籍智能處理而設計，在推動中國古籍研究與保護工作創新發展、提高中華傳統文化傳承的效率與質量、實現大語言模型與古籍處理的深度融合上提供重要支撐。該模型作為開源公益研究成果已在GitHub、ModelScope等網站發佈，用戶可免費下載部署使用。

據介紹，王東波教授研究團隊在南京農業大學高算力基礎設施支持下，持續10年深耕古籍文獻數字化研究，同時依托中華書局提供的應用場景，在古籍開源大語言模型上實現AI人工智能垂直細分領域的全國首創。

該開源模型包括兩個部分：基座模型XunziALLM與對話模型XunziChat。

其模型亮點包括：智能標引，能夠對古籍中的內容進行高質量主題標引，幫助研究人員快速了解文章主題；

信息抽取，能夠自動從古籍中抽取關鍵信息，如人物、事件、地點等，大大節省了信息整理時間；

詩歌生成，能夠根據給定的主題或關鍵詞，自動生成符合語法規則和韻律要求的古詩，為詩詞愛好者提供創作靈感；

高質量翻譯，對於難以理解的古籍文獻，能夠進行精準的現代文翻譯，幫助研究人員更好地理解原文含義；

閱讀理解，能夠對給出的古文文本進行分析解釋，實現對古籍文本的自動閱讀；

詞法分析，可以完成古籍文本的自動分詞和詞性標註，有效提升研究效率；

自動標點，可以快速完成古籍文本的斷句和標點，提升使用者對古籍文本的閱讀體驗。

此外，同時發佈的基座模型，用戶也可以根據自己的需求，使用本地的訓練語料微調“荀子”基座模型，使其在古籍下遊處理任務上取得更優越的處理性能。（完）

【編輯：丘志彬】

相關新聞

中國發布海洋垂直領域大語言模型“瀚海智語”

港大深圳醫院部署AI大模型助力醫療智能化發展

外媒解讀王毅引文談中美關係

科大訊飛港澳業務再佈局 SaaS產品宣佈港澳地區上線

首部中國AI動畫《千秋詩頌》啟播

北京見聞：科技融入生活　北京“未來感”圖書館走紅

漢語盤點2023”發佈中國年度十大流行語、十大網絡用語、十大新詞語

中國發布十大新詞語“村超”等入選

城市大學舉辦書藝同行展呈現圖書館裡的中韓人文交流史

台“自研”AI抄襲大陸成果？台“中研院”院長辯稱“研究員求快心切”

台“自研”AI語言模型答問顯示“台灣屬於中國”

外籍專家眼中的二十大報告丨福佩吉：二十大報告充滿智慧

視頻

更多

首張黑洞照片的背後　有一位從香港走出的天文學家

【通說環球】關稅戰打不下去了？美國急邀中國談判　雙方能否達成共識？

廉政公署展覽廳“科技感十足”　廉政專員：打造成香港獨特的文化景點

2025長洲飘色巡游看呆外國遊客！哪吒成最熱門角色

2025“包山王”“包山后”誕生！三度封后的“包山后”竟也會被對手“迷惑”險失誤？

享年107歲　台灣統派精神領袖許歷農離世

【通講壇】“胡連會”20年　兩岸還有和平的未來嗎？

來論

更多

論壇

更多

圖集

更多

台灣鹿港老街濃濃的懷舊風情

深圳錦綉中華周末邀護士暨家人暖心暢游

香港數碼港低空經濟展覽開幕

閱讀排行

友情鏈接

關於我們

Copyright © 2009-2023 All Rights Reserved 香港中國通訊社有限公司版權所有

承印人：香港中國通訊社有限公司

承印地址: 香港南區黃竹坑道21號環匯廣場30樓

Tel: (+852) 28561919 Fax: (+852) 25647453