曾經(jīng),“百模大戰(zhàn)”是AI創(chuàng)業(yè)領(lǐng)域的關(guān)鍵詞,從通用大模型到行業(yè)模型,參數(shù)規(guī)模不斷突破,融資金額持續(xù)攀升,市場一度形成“不做大模型就會被淘汰”的強烈共識。然而,如今風(fēng)向已悄然轉(zhuǎn)變,無論是在硅谷還是國內(nèi)創(chuàng)投圈,單純以“打造大模型”為核心賣點的創(chuàng)業(yè)項目熱度迅速下降,輕量化小模型、AI Agent以及設(shè)備端(On-Device)AI等方向正成為新的熱門賽道。
這一轉(zhuǎn)變并非技術(shù)熱情的消退,而是成本、商業(yè)化和資本邏輯共同作用下的理性回歸。在2026年的國際消費類電子產(chǎn)品展覽會(CES)上,這一趨勢尤為顯著。設(shè)備端AI創(chuàng)業(yè)公司Aizip的聯(lián)合創(chuàng)始人陳羽北在接受采訪時表示,設(shè)備端AI正成為創(chuàng)業(yè)公司競相涌入的新賽道。陳羽北是典型的在美華人工程師,擁有清華大學(xué)學(xué)士和加州大學(xué)伯克利分校博士學(xué)位,目前還在加州大學(xué)戴維斯分校任教并開展創(chuàng)業(yè)項目。
陳羽北介紹,設(shè)備端AI通過“用大模型生成小模型”的方式,利用收集數(shù)據(jù)、購買數(shù)據(jù)和大模型蒸餾三種途徑獲取所需數(shù)據(jù),讓AI能夠直接在終端設(shè)備上運行,無需依賴云端或網(wǎng)絡(luò)。這種模式不僅降低了成本,還保障了數(shù)據(jù)隱私,使智能應(yīng)用能夠快速落地。目前,Aizip的設(shè)備端AI模型已在多個終端品牌實現(xiàn)應(yīng)用,并與軟銀、ARM、Microchip等全球多家頭部硬件廠商展開合作。
2025年12月,OpenAI首席執(zhí)行官山姆·奧特曼發(fā)出“紅色警報”,要求公司加速推進ChatGPT相關(guān)工作,推遲其他產(chǎn)品開發(fā),以應(yīng)對谷歌Gemini3等對手的競爭壓力。盡管大模型領(lǐng)域的競爭愈發(fā)激烈,但進入該賽道的競爭者數(shù)量卻在減少,行業(yè)逐漸形成共識:大模型之戰(zhàn)將成為資本雄厚的巨頭之間的爭奪。
多位參與CES的風(fēng)投圈人士和AI企業(yè)創(chuàng)業(yè)者表示,大模型已成為高度資本密集型的競賽。千億參數(shù)模型的單次訓(xùn)練成本高達數(shù)千萬美元,推理階段的算力消耗同樣驚人。隨著GPU價格居高不下、云算力賬單持續(xù)攀升,大模型的“邊際成本”并未如預(yù)期般快速下降。對于創(chuàng)業(yè)公司而言,這意味著資金消耗速度遠超傳統(tǒng)軟件創(chuàng)業(yè),且即便模型性能提升,商業(yè)化路徑仍充滿不確定性。多位投資人私下直言,大模型項目正成為“技術(shù)可行,但財務(wù)模型難以自洽”的典型案例。
在此背景下,更多資本和AI創(chuàng)業(yè)者將目光轉(zhuǎn)向輕量化模型和AI Agent,Aizip便是其中之一。盡管大模型縮放定律(即訓(xùn)練數(shù)據(jù)和模型參數(shù)越大,模型智能越強)仍然有效,但AI從業(yè)者也意識到,不應(yīng)盲目追求算力。陳羽北回憶,博士畢業(yè)后,他意識到自己在工程能力上存在短板,于是加入Yann LeCun的團隊,在Facebook AI Research以及紐約大學(xué)從事博士后研究,這段經(jīng)歷幫助他補齊了模型工程化與規(guī)模化模型訓(xùn)練的能力。
“當(dāng)時,我們能夠直接使用配備512張V100顯卡的大規(guī)模算力進行訓(xùn)練。寫一篇論文消耗的計算資源可能就要花費上百萬美元。Scaling確實有效——更多的數(shù)據(jù)、更大的模型以及更直接的優(yōu)化通常能帶來性能提升,但并非總是成正比。”陳羽北說。例如,數(shù)據(jù)規(guī)模擴大300倍,模型性能可能僅提升個位數(shù)的百分點。這讓他開始反思數(shù)據(jù)質(zhì)量、模型結(jié)構(gòu)、工程嚴謹性等因素的實際影響。近年來,許多AI創(chuàng)業(yè)公司盲目推高模型規(guī)模,資源已用到極限,卻很難再從縮放中獲得突破。因此,陳羽北認為,要尊重縮放定律,但不能迷信它。“特別是在創(chuàng)業(yè)時,我們的思路是反向的——不是追求更大,而是打造‘全球最小、最高效’的AI系統(tǒng)。這與主流強調(diào)通用人工智能(AGI)、取代人的方向并不一致。”
設(shè)備端AI正是在這樣的背景下成為全球AI界熱門的新興方向。簡單來說,設(shè)備端AI直接在手機、筆記本、相機等設(shè)備上運行,不依賴云端或互聯(lián)網(wǎng)。其特點在于輕量化模型適合本地處理少量數(shù)據(jù),響應(yīng)速度快、延遲低,且數(shù)據(jù)不出設(shè)備,安全性更高。例如,手機拍照的自動美顏和夜景增強功能、iPhone上的Siri或照片識別功能、智能門鎖或家用機器人的語音和圖像處理功能等。
陳羽北介紹,Aizip本質(zhì)上是一家純軟件公司,專注于AI模型的研發(fā),在大模型的基礎(chǔ)上訓(xùn)練、生成適合各種垂直場景的小模型。同時,創(chuàng)業(yè)團隊對硬件有深入理解,聯(lián)合創(chuàng)始人過去創(chuàng)立的公司曾服務(wù)于Apple等客戶。“設(shè)備端AI模型的訓(xùn)練主要通過收集數(shù)據(jù)、購買數(shù)據(jù)和大模型蒸餾三種途徑,同時要評估數(shù)據(jù)合規(guī)性,使用高質(zhì)量的產(chǎn)品級數(shù)據(jù)。”他表示,盡管目前專注于本地化智能賽道,但也會對標Gemini等優(yōu)秀模型,在細分應(yīng)用上追求達到或超越其性能,可利用視覺語言模型(VLM)。盡管縮放定律仍然有效,但在需求明確的應(yīng)用上,大模型的縮放定律可能會逐步失效。
據(jù)觀察,當(dāng)前卡拉OK聲音解決方案、智能攝像頭、智能喚醒助手三類應(yīng)用場景的商業(yè)化前景尤為突出。以卡拉OK聲音解決方案為例,傳統(tǒng)卡拉OK或在線唱歌應(yīng)用中,用戶只能使用原版伴奏或在線處理,而端側(cè)解決方案能夠直接在用戶設(shè)備上完成聲音分離,識別并消除歌曲中的人聲部分,只保留背景音樂,無需上傳歌曲到云端或依賴在線計算。
再以智能攝像頭為例,端側(cè)識別與安全報警功能具備商用潛力。AI解決方案使攝像頭能夠在設(shè)備端完成復(fù)雜的圖像識別任務(wù),例如區(qū)分來訪人員身份(是快遞員還是潛在偷取快遞的陌生人),并實時提醒無法全程監(jiān)控環(huán)境的用戶。如果識別到異常行為,攝像頭能夠自動發(fā)出報警信號,提示用戶采取措施。這種模式對家庭、社區(qū)和物流企業(yè)而言,具備實時性、安全性和隱私保護的三重優(yōu)勢,用戶無需擔(dān)心攝像頭數(shù)據(jù)被傳到云端或被第三方訪問。
陳羽北坦言,目前真正的設(shè)備端AI革命尚未到來,但市場熱度比之前更高,從產(chǎn)品化、落地和客戶需求來看,進入真實產(chǎn)品場景的數(shù)量正在增多。未來發(fā)展的關(guān)鍵在于更多剛需應(yīng)用的出現(xiàn),如智能手表的語音能力、嬰兒監(jiān)控攝像頭等,這些應(yīng)用能夠培養(yǎng)用戶習(xí)慣,且注重隱私保護,將AI能力放到本地。
他還提到,當(dāng)前行業(yè)對AI模型訓(xùn)練人才和算力的需求依然極高,華人工程師在AI浪潮中扮演了關(guān)鍵角色。這源于他們的優(yōu)勢——數(shù)理基礎(chǔ)好、工作努力、學(xué)習(xí)新技術(shù)速度快、解決工程類問題能力強,在既定賽道發(fā)展較快。相比之下,美國頂尖工程師也有自己的特長,他們的思想更自由,更敢于打破常規(guī)想象,在創(chuàng)造新路線方面更具創(chuàng)新思考能力。















