在人工智能領(lǐng)域,衡量技術(shù)進步與商業(yè)價值的標準正經(jīng)歷一場深刻變革。meta公司曾推行一項名為“Claudeonomics”的內(nèi)部競賽,8.5萬名員工在30天內(nèi)消耗60萬億個計算單位(Token),其中排名首位的員工單月消耗量達2810億個。這種以計算資源消耗論英雄的模式,暴露出行業(yè)普遍存在的認知偏差:將技術(shù)投入等同于實際產(chǎn)出,用成本指標替代價值評估。
這種評估體系的弊端在業(yè)務(wù)層面顯現(xiàn)無遺。部分員工為追求排名,重復調(diào)用模型進行無效推理,導致算力資源嚴重浪費。更值得警惕的是,整個行業(yè)逐漸形成“Token消耗競賽”的怪圈:企業(yè)比拼模型規(guī)模,廠商炫耀用戶調(diào)用量,會議PPT充斥著天文數(shù)字般的計算量。這種邏輯與商業(yè)本質(zhì)背道而馳——正如電力消耗不能直接反映企業(yè)盈利能力,計算單位的消耗量也無法準確衡量人工智能創(chuàng)造的實際價值。
行業(yè)轉(zhuǎn)折點出現(xiàn)在2026年5月的百度AI開發(fā)者大會上。百度創(chuàng)始人提出“DAA”(Daily Active Agents,日活智能體數(shù))概念,主張用智能體實際完成的任務(wù)量替代傳統(tǒng)評估指標。這個轉(zhuǎn)變并非孤立事件:Salesforce同期推出AWU(Agentic Work Units)標準,將單個智能體完成的全流程任務(wù)作為計量單位;Gartner研究報告明確指出,過度依賴Token消耗指標可能誤導企業(yè)發(fā)展方向。
市場數(shù)據(jù)為這種轉(zhuǎn)變提供有力支撐。以企業(yè)服務(wù)見長的Anthropic公司,其產(chǎn)品日活躍用戶數(shù)僅為OpenAI的2%,但2026年5月年化營收達到440億美元,較2024年增長43倍。這種反差揭示出人工智能商業(yè)化的本質(zhì)規(guī)律:客戶真正關(guān)注的是任務(wù)完成效率,而非模型調(diào)用規(guī)模。OpenAI內(nèi)部人士透露,該公司正在調(diào)整評估體系,弱化用戶規(guī)模指標,轉(zhuǎn)向更注重實際產(chǎn)出的新標準。
新舊評估體系的差異體現(xiàn)在三個維度:傳統(tǒng)DAU(日活躍用戶)衡量的是用戶注意力,Token消耗反映的是計算成本,而DAA關(guān)注的是智能體實際交付的業(yè)務(wù)成果。以財務(wù)報告生成為例,用戶與AI的百次對話消耗的Token量,可能與智能體自動完成報告分析的消耗相當,但后者創(chuàng)造的價值顯然更高。這種差異促使企業(yè)重新思考技術(shù)投入的產(chǎn)出效率。
技術(shù)架構(gòu)的革新為新評估體系提供支撐。百度構(gòu)建的完整技術(shù)棧包含四個關(guān)鍵層級:昆侖芯3萬卡級集群提供算力基礎(chǔ),天池超節(jié)點解決擴容需求,文心5.1模型降低預訓練成本,DuMate通用智能體平臺實現(xiàn)應(yīng)用落地。這種全棧布局確保智能體既能高效運行,又能保持經(jīng)濟性——預訓練成本控制在行業(yè)平均水平的6%,為大規(guī)模部署創(chuàng)造條件。
智能體經(jīng)濟的爆發(fā)已現(xiàn)端倪。Gartner預測,到2026年底,40%的企業(yè)應(yīng)用將嵌入任務(wù)型AI智能體。中國市場表現(xiàn)尤為突出,企業(yè)級智能體市場規(guī)模突破480億元。用戶手機中的導航、支付、推薦等智能體,數(shù)量早已超過通訊錄聯(lián)系人。這種趨勢正在重塑生產(chǎn)力結(jié)構(gòu):個人通過多個智能體擴展能力邊界,企業(yè)構(gòu)建人機混合團隊提升效率,智能體從輔助工具進化為獨立生產(chǎn)力單元。
行業(yè)領(lǐng)導者已開始布局這場變革。谷歌在I/O開發(fā)者大會上推出“Agentic Gemini Era”戰(zhàn)略,包含智能體編排框架、專用通信協(xié)議和定制芯片。百度提出的“自我進化”理念更具前瞻性:智能體從被動響應(yīng)轉(zhuǎn)向主動執(zhí)行,人類從單兵作戰(zhàn)升級為超級個體,企業(yè)組織架構(gòu)演變?yōu)槿藱C混合編隊。這種變革預示著,最小生產(chǎn)力單元將不再是傳統(tǒng)團隊,而是“個人+智能體集群”的全新組合。















