黄色三级不卡在线观看-男男视频网站高清观看-久久国产欧美韩国精品app-免费观看妇女A级视频-中文字幕一区二区三区人妻在线视频-国产精选av一区二区-欧美亚洲精品不卡一区二区-99女福利女女视频在线播放-国产美女香蕉久久精品

  • 虎科技 - 領(lǐng)先的互聯(lián)網(wǎng)科技媒體

阿里巴巴申請新專利:以思維鏈訓練提升語言模型可解釋性與審核精度

   時間:2026-02-14 03:31 來源:天脈網(wǎng)作者:柳晴雪

阿里巴巴(中國)有限公司近期在專利領(lǐng)域邁出重要一步,企查查APP最新信息顯示,該公司已正式申請公布一項名為“一種基于思維鏈訓練大型語言模型的方法、裝置和設備”的專利技術(shù)。

據(jù)專利摘要介紹,這項創(chuàng)新技術(shù)通過構(gòu)建多維度數(shù)據(jù)體系優(yōu)化模型訓練流程。研究團隊首先采集包含圖像、輔助文本說明及標準審核結(jié)果的大規(guī)模初始數(shù)據(jù)集,隨后運用這些數(shù)據(jù)生成結(jié)構(gòu)化的思維鏈數(shù)據(jù)集合。該數(shù)據(jù)集被用于對基礎(chǔ)語言模型進行全量參數(shù)微調(diào),形成具備初步處理能力的中間模型。

在迭代優(yōu)化階段,技術(shù)人員采用雙軌并進策略:一方面持續(xù)利用原始數(shù)據(jù)生成新的中間思維鏈數(shù)據(jù),另一方面通過預設的獎勵函數(shù)對生成數(shù)據(jù)進行質(zhì)量評估。特別值得關(guān)注的是,該專利創(chuàng)新性地引入組相對策略優(yōu)化算法(GRPO),通過強化學習機制對中間模型進行深度優(yōu)化,最終形成具備高解釋性和精準審核能力的目標語言模型。

這項技術(shù)的突破性在于構(gòu)建了數(shù)據(jù)生成-模型微調(diào)-強化學習的完整閉環(huán)。通過思維鏈數(shù)據(jù)的有序傳遞,既保證了模型訓練過程的可追溯性,又顯著提升了復雜場景下的審核準確率。專利文件特別強調(diào),該技術(shù)方案特別適用于需要高精度內(nèi)容審核的商業(yè)場景,能夠有效降低人工復核成本,提升系統(tǒng)整體運行效率。

 
 
更多>同類內(nèi)容
推薦圖文
推薦內(nèi)容
點擊排行
 
智快科技微信賬號
ITBear微信賬號

微信掃一掃
加微信拉群
電動汽車群
科技數(shù)碼群