黄色三级不卡在线观看-男男视频网站高清观看-久久国产欧美韩国精品app-免费观看妇女A级视频-中文字幕一区二区三区人妻在线视频-国产精选av一区二区-欧美亚洲精品不卡一区二区-99女福利女女视频在线播放-国产美女香蕉久久精品

  • 虎科技 - 領(lǐng)先的互聯(lián)網(wǎng)科技媒體

DeepSeek新年首篇論文問(wèn)世:mHC新架構(gòu)登場(chǎng) 梁文鋒位列作者團(tuán)隊(duì)

   時(shí)間:2026-01-01 20:14 來(lái)源:互聯(lián)網(wǎng)作者:鐘景軒

近日,人工智能領(lǐng)域迎來(lái)一項(xiàng)重要突破,DeepSeek團(tuán)隊(duì)公布了一篇關(guān)于新型神經(jīng)網(wǎng)絡(luò)架構(gòu)的研究論文,提出名為“流形約束超連接”(mHC)的創(chuàng)新框架。該研究針對(duì)傳統(tǒng)超連接技術(shù)在大規(guī)模模型訓(xùn)練中存在的穩(wěn)定性問(wèn)題展開(kāi)探索,旨在通過(guò)結(jié)構(gòu)優(yōu)化實(shí)現(xiàn)性能與效率的雙重提升。

論文核心團(tuán)隊(duì)由三位年輕研究者主導(dǎo),分別是解振達(dá)、韋毅軒與曹煥琦,DeepSeek創(chuàng)始人梁文鋒亦參與其中。研究指出,近年來(lái)以超連接(HC)為代表的技術(shù)通過(guò)拓寬殘差流路徑、豐富連接模式,顯著提升了模型性能,但這種復(fù)雜化設(shè)計(jì)破壞了殘差連接固有的恒等映射特性,導(dǎo)致訓(xùn)練過(guò)程易出現(xiàn)不穩(wěn)定現(xiàn)象,同時(shí)伴隨高昂的內(nèi)存訪(fǎng)問(wèn)成本,限制了技術(shù)的進(jìn)一步擴(kuò)展。

針對(duì)上述痛點(diǎn),mHC框架通過(guò)數(shù)學(xué)投影將超連接的殘差空間約束至特定流形結(jié)構(gòu),在保留多樣化連接優(yōu)勢(shì)的同時(shí),重構(gòu)了恒等映射的穩(wěn)定性基礎(chǔ)。研究團(tuán)隊(duì)同步開(kāi)發(fā)了配套的基礎(chǔ)設(shè)施優(yōu)化方案,確保新架構(gòu)在硬件層面的高效運(yùn)行。實(shí)驗(yàn)數(shù)據(jù)顯示,該技術(shù)在大規(guī)模訓(xùn)練場(chǎng)景中表現(xiàn)出色,不僅實(shí)現(xiàn)了性能的實(shí)質(zhì)性提升,更展現(xiàn)出優(yōu)異的擴(kuò)展能力。

這項(xiàng)成果被視為對(duì)神經(jīng)網(wǎng)絡(luò)拓?fù)湓O(shè)計(jì)的重要補(bǔ)充。研究團(tuán)隊(duì)認(rèn)為,mHC作為超連接技術(shù)的實(shí)用化延伸,為理解復(fù)雜架構(gòu)的內(nèi)在機(jī)制提供了新視角,其設(shè)計(jì)理念或可推動(dòng)基礎(chǔ)模型向更高效、更穩(wěn)定的方向演進(jìn)。目前,相關(guān)代碼與實(shí)驗(yàn)細(xì)節(jié)已通過(guò)論文形式公開(kāi),供學(xué)術(shù)界與產(chǎn)業(yè)界驗(yàn)證參考。

 
 
更多>同類(lèi)內(nèi)容
推薦圖文
推薦內(nèi)容
點(diǎn)擊排行
 
智快科技微信賬號(hào)
ITBear微信賬號(hào)

微信掃一掃
加微信拉群
電動(dòng)汽車(chē)群
科技數(shù)碼群