上證報中國證券網(wǎng)7月26日消息,記者劉怡鶴報道,在2025世界人工智能大會“AI煥新產(chǎn)業(yè)共贏”企業(yè)人工智能產(chǎn)業(yè)發(fā)展論壇上,中國移動正式發(fā)布“九天”基礎(chǔ)大模型3.0。
據(jù)了解,“九天”基礎(chǔ)大模型3.0進一步突出了“高安全、高可控、全國產(chǎn)、全行業(yè)”四大特性,主要有三大亮點。
其一,九天眾擎語言大模型在架構(gòu)與性能上實現(xiàn)雙重飛躍。該模型開創(chuàng)性地運用可擴展至萬億級的MoE架構(gòu),借助15T token多階段配比預(yù)訓(xùn)練數(shù)據(jù)與全流程治理體系,強化推理能力。同時,創(chuàng)新構(gòu)建113域×53能力的二維分級后訓(xùn)練框架,并結(jié)合動態(tài)強化學(xué)習(xí)策略,使復(fù)雜推理能力提升了35%。此外,模型還增強了可控生成能力,攻克了沉浸式角色演繹、精確流程內(nèi)置等技術(shù)難題,達(dá)成專業(yè)場景零幻覺?;诖苏Z言大模型,中國移動此次還推出了多個專項模型,如九天代碼大模型、九天數(shù)學(xué)大模型等。
其二,九天善智多模態(tài)大模型全方位提升了生成可控性與理解能力。該模型依托復(fù)雜時空建模、流匹配圖片視頻漸進式聯(lián)合訓(xùn)練、端到端局部可控注意力機制等創(chuàng)新技術(shù),引入多模態(tài)理解信息,增強對文本指令和輸入條件圖像視頻的感知能力。通過聯(lián)合圖文交織數(shù)據(jù)訓(xùn)練,它既能生成高質(zhì)量的圖像視頻,又能進行多輪對話式高可控精確編輯操作,大大提高了視覺生成的靈活便利性,在圖理解和視頻理解方面的性能也有顯著提升。
其三,模型及核心技術(shù)實現(xiàn)開源。中國移動開源了九天數(shù)童結(jié)構(gòu)化數(shù)據(jù)大模型、九天數(shù)學(xué)大模型、九天代碼大模型,以及業(yè)界首創(chuàng)的結(jié)構(gòu)化數(shù)據(jù)模型評測數(shù)據(jù)及TReB評測體系、CCR - Bench行業(yè)場景復(fù)雜指令遵循評測數(shù)據(jù)集等。相關(guān)內(nèi)容已在煥新社區(qū)、Github、HuggingFace、魔搭社區(qū)、Gitee、Arxiv等平臺上線。
相關(guān)標(biāo)簽:
Ai滾動快訊重要提示: 以上內(nèi)容由AI根據(jù)公開數(shù)據(jù)自動生成,僅供參考、交流、學(xué)習(xí),不構(gòu)成投資建議。如不希望您的內(nèi)容在本站出現(xiàn),可發(fā)郵件至ljcj@leju.com或點擊【聯(lián)系客服】要求撤下。未經(jīng)允許,任何單位或個人不得在任何平臺公開傳播使用本文內(nèi)容。
樂居財經(jīng)APP
?2017-2025 北京怡生樂居財經(jīng)文化傳媒有限公司 北京市朝陽區(qū)西大望路甲22號院1號樓1層101內(nèi)3層S3-01房間756號 100016
京ICP備2021030296號-2京公網(wǎng)安備 11010502047973號