近期,科技領(lǐng)域關(guān)于“token工廠”與“token運(yùn)營(yíng)”的討論熱度持續(xù)攀升,成為行業(yè)關(guān)注焦點(diǎn)。這一新興概念正引發(fā)科技企業(yè)戰(zhàn)略布局的深刻調(diào)整,其背后的商業(yè)模式與競(jìng)爭(zhēng)邏輯值得深入剖析。
從商業(yè)模式來(lái)看,token工廠與token運(yùn)營(yíng)呈現(xiàn)截然不同的特征。token工廠采用重資產(chǎn)模式,需自建或租用算力基礎(chǔ)設(shè)施,如同傳統(tǒng)實(shí)體工廠般承擔(dān)token生產(chǎn)職能;而token運(yùn)營(yíng)則走輕資產(chǎn)路線,通過(guò)聚合平臺(tái)或分發(fā)方角色提供技術(shù)服務(wù),對(duì)算力持有量要求較低。這種差異直接體現(xiàn)在收入結(jié)構(gòu)上:算力租賃依賴(lài)固定五年期租金,收入彈性有限;而token工廠與運(yùn)營(yíng)的收入與token消耗量線性掛鉤,隨著AI推理需求爆發(fā),其增長(zhǎng)潛力顯著優(yōu)于前者。
在收益分配機(jī)制方面,token工廠與模型公司形成緊密的利益綁定。雙方按token調(diào)用量進(jìn)行分成,典型比例為70:30,但具體比例會(huì)因模型屬性調(diào)整。例如,強(qiáng)勢(shì)閉源模型可能將分成改為60:40,而算力緊張的模型方(如智譜)甚至愿意讓出80%的收益。這種模式使token工廠收入與模型公司表現(xiàn)正相關(guān),同時(shí)因邊際成本較低而具備高盈利彈性。
大型科技企業(yè)紛紛從算力租賃轉(zhuǎn)向token工廠領(lǐng)域,背后存在多重驅(qū)動(dòng)因素。合規(guī)風(fēng)險(xiǎn)是首要考量:英偉達(dá)高端顯卡受美國(guó)出口管制,若集中部署于大廠機(jī)房可能引發(fā)合規(guī)隱患,而通過(guò)第三方托管可有效降低風(fēng)險(xiǎn)。運(yùn)營(yíng)效率方面,大廠無(wú)需自建運(yùn)維體系,可將平臺(tái)搭建、優(yōu)化等環(huán)節(jié)外包,實(shí)現(xiàn)“輕裝上陣”。更關(guān)鍵的是,這種轉(zhuǎn)型推動(dòng)資本支出向運(yùn)營(yíng)支出轉(zhuǎn)化,緩解了科技巨頭持續(xù)攀升的資本開(kāi)支壓力——數(shù)據(jù)顯示,海外四大科技企業(yè)2026年資本開(kāi)支已占經(jīng)營(yíng)性現(xiàn)金流的90%以上。
盈利能力對(duì)比顯示,token工廠毛利率可達(dá)50%左右,這一數(shù)據(jù)得到潤(rùn)建股份電話會(huì)議及海外Fireworks、Together AI等企業(yè)的驗(yàn)證,遠(yuǎn)超算力租賃行業(yè)水平。其核心競(jìng)爭(zhēng)要素并非算力規(guī)模,而是“每瓦產(chǎn)出token”的效率。通過(guò)推理優(yōu)化技術(shù)(包括量化、算子重寫(xiě)、KV cache優(yōu)化、云調(diào)度等),企業(yè)可顯著降低延遲、提升資源利用率并降低成本。例如,Nebius收購(gòu)AGAI團(tuán)隊(duì)后,將延遲降低40-60%,利用率翻倍,成本降幅達(dá)40-50%。
行業(yè)觀察人士指出,當(dāng)前市場(chǎng)對(duì)這一領(lǐng)域的態(tài)度呈現(xiàn)分化:部分謹(jǐn)慎者開(kāi)始擔(dān)憂宏觀風(fēng)險(xiǎn),而早期獲益者仍堅(jiān)持積極布局。與此同時(shí),技術(shù)探索方向日益多元,SpaceX的航天創(chuàng)新、機(jī)器人技術(shù)突破、mircoLED與玻璃基板顯示技術(shù)、M10芯片研發(fā)、柔性疊層光伏等前沿領(lǐng)域,均成為企業(yè)尋求新增長(zhǎng)點(diǎn)的試驗(yàn)場(chǎng)。這種技術(shù)路線的分散化,既反映了行業(yè)對(duì)單一賽道風(fēng)險(xiǎn)的規(guī)避,也預(yù)示著科技競(jìng)爭(zhēng)正進(jìn)入多維博弈的新階段。















