成本與效率驅(qū)動新風(fēng)向：AI創(chuàng)業(yè)者轉(zhuǎn)向設(shè)備端輕量化模型賽道

發(fā)布時間：2026-01-10 12:15 來源：快訊作者：陳麗

曾經(jīng)，“百模大戰(zhàn)”是AI創(chuàng)業(yè)領(lǐng)域的關(guān)鍵詞，從通用大模型到行業(yè)模型，參數(shù)規(guī)模不斷突破，融資金額持續(xù)攀升，市場一度形成“不做大模型就會被淘汰”的強烈共識。然而，如今風(fēng)向已悄然轉(zhuǎn)變，無論是在硅谷還是國內(nèi)創(chuàng)投圈，單純以“打造大模型”為核心賣點的創(chuàng)業(yè)項目熱度迅速下降，輕量化小模型、AI Agent以及設(shè)備端（On-Device）AI等方向正成為新的熱門賽道。

這一轉(zhuǎn)變并非技術(shù)熱情的消退，而是成本、商業(yè)化和資本邏輯共同作用下的理性回歸。在2026年的國際消費類電子產(chǎn)品展覽會（CES）上，這一趨勢尤為顯著。設(shè)備端AI創(chuàng)業(yè)公司Aizip的聯(lián)合創(chuàng)始人陳羽北在接受采訪時表示，設(shè)備端AI正成為創(chuàng)業(yè)公司競相涌入的新賽道。陳羽北是典型的在美華人工程師，擁有清華大學(xué)學(xué)士和加州大學(xué)伯克利分校博士學(xué)位，目前還在加州大學(xué)戴維斯分校任教并開展創(chuàng)業(yè)項目。

陳羽北介紹，設(shè)備端AI通過“用大模型生成小模型”的方式，利用收集數(shù)據(jù)、購買數(shù)據(jù)和大模型蒸餾三種途徑獲取所需數(shù)據(jù)，讓AI能夠直接在終端設(shè)備上運行，無需依賴云端或網(wǎng)絡(luò)。這種模式不僅降低了成本，還保障了數(shù)據(jù)隱私，使智能應(yīng)用能夠快速落地。目前，Aizip的設(shè)備端AI模型已在多個終端品牌實現(xiàn)應(yīng)用，并與軟銀、ARM、Microchip等全球多家頭部硬件廠商展開合作。

2025年12月，OpenAI首席執(zhí)行官山姆·奧特曼發(fā)出“紅色警報”，要求公司加速推進ChatGPT相關(guān)工作，推遲其他產(chǎn)品開發(fā)，以應(yīng)對谷歌Gemini3等對手的競爭壓力。盡管大模型領(lǐng)域的競爭愈發(fā)激烈，但進入該賽道的競爭者數(shù)量卻在減少，行業(yè)逐漸形成共識：大模型之戰(zhàn)將成為資本雄厚的巨頭之間的爭奪。

多位參與CES的風(fēng)投圈人士和AI企業(yè)創(chuàng)業(yè)者表示，大模型已成為高度資本密集型的競賽。千億參數(shù)模型的單次訓(xùn)練成本高達數(shù)千萬美元，推理階段的算力消耗同樣驚人。隨著GPU價格居高不下、云算力賬單持續(xù)攀升，大模型的“邊際成本”并未如預(yù)期般快速下降。對于創(chuàng)業(yè)公司而言，這意味著資金消耗速度遠超傳統(tǒng)軟件創(chuàng)業(yè)，且即便模型性能提升，商業(yè)化路徑仍充滿不確定性。多位投資人私下直言，大模型項目正成為“技術(shù)可行，但財務(wù)模型難以自洽”的典型案例。

在此背景下，更多資本和AI創(chuàng)業(yè)者將目光轉(zhuǎn)向輕量化模型和AI Agent，Aizip便是其中之一。盡管大模型縮放定律（即訓(xùn)練數(shù)據(jù)和模型參數(shù)越大，模型智能越強）仍然有效，但AI從業(yè)者也意識到，不應(yīng)盲目追求算力。陳羽北回憶，博士畢業(yè)后，他意識到自己在工程能力上存在短板，于是加入Yann LeCun的團隊，在Facebook AI Research以及紐約大學(xué)從事博士后研究，這段經(jīng)歷幫助他補齊了模型工程化與規(guī)模化模型訓(xùn)練的能力。

“當(dāng)時，我們能夠直接使用配備512張V100顯卡的大規(guī)模算力進行訓(xùn)練。寫一篇論文消耗的計算資源可能就要花費上百萬美元。Scaling確實有效——更多的數(shù)據(jù)、更大的模型以及更直接的優(yōu)化通常能帶來性能提升，但并非總是成正比。”陳羽北說。例如，數(shù)據(jù)規(guī)模擴大300倍，模型性能可能僅提升個位數(shù)的百分點。這讓他開始反思數(shù)據(jù)質(zhì)量、模型結(jié)構(gòu)、工程嚴謹性等因素的實際影響。近年來，許多AI創(chuàng)業(yè)公司盲目推高模型規(guī)模，資源已用到極限，卻很難再從縮放中獲得突破。因此，陳羽北認為，要尊重縮放定律，但不能迷信它。“特別是在創(chuàng)業(yè)時，我們的思路是反向的——不是追求更大，而是打造‘全球最小、最高效’的AI系統(tǒng)。這與主流強調(diào)通用人工智能（AGI）、取代人的方向并不一致。”

設(shè)備端AI正是在這樣的背景下成為全球AI界熱門的新興方向。簡單來說，設(shè)備端AI直接在手機、筆記本、相機等設(shè)備上運行，不依賴云端或互聯(lián)網(wǎng)。其特點在于輕量化模型適合本地處理少量數(shù)據(jù)，響應(yīng)速度快、延遲低，且數(shù)據(jù)不出設(shè)備，安全性更高。例如，手機拍照的自動美顏和夜景增強功能、iPhone上的Siri或照片識別功能、智能門鎖或家用機器人的語音和圖像處理功能等。

陳羽北介紹，Aizip本質(zhì)上是一家純軟件公司，專注于AI模型的研發(fā)，在大模型的基礎(chǔ)上訓(xùn)練、生成適合各種垂直場景的小模型。同時，創(chuàng)業(yè)團隊對硬件有深入理解，聯(lián)合創(chuàng)始人過去創(chuàng)立的公司曾服務(wù)于Apple等客戶。“設(shè)備端AI模型的訓(xùn)練主要通過收集數(shù)據(jù)、購買數(shù)據(jù)和大模型蒸餾三種途徑，同時要評估數(shù)據(jù)合規(guī)性，使用高質(zhì)量的產(chǎn)品級數(shù)據(jù)。”他表示，盡管目前專注于本地化智能賽道，但也會對標Gemini等優(yōu)秀模型，在細分應(yīng)用上追求達到或超越其性能，可利用視覺語言模型（VLM）。盡管縮放定律仍然有效，但在需求明確的應(yīng)用上，大模型的縮放定律可能會逐步失效。

據(jù)觀察，當(dāng)前卡拉OK聲音解決方案、智能攝像頭、智能喚醒助手三類應(yīng)用場景的商業(yè)化前景尤為突出。以卡拉OK聲音解決方案為例，傳統(tǒng)卡拉OK或在線唱歌應(yīng)用中，用戶只能使用原版伴奏或在線處理，而端側(cè)解決方案能夠直接在用戶設(shè)備上完成聲音分離，識別并消除歌曲中的人聲部分，只保留背景音樂，無需上傳歌曲到云端或依賴在線計算。

再以智能攝像頭為例，端側(cè)識別與安全報警功能具備商用潛力。AI解決方案使攝像頭能夠在設(shè)備端完成復(fù)雜的圖像識別任務(wù)，例如區(qū)分來訪人員身份（是快遞員還是潛在偷取快遞的陌生人），并實時提醒無法全程監(jiān)控環(huán)境的用戶。如果識別到異常行為，攝像頭能夠自動發(fā)出報警信號，提示用戶采取措施。這種模式對家庭、社區(qū)和物流企業(yè)而言，具備實時性、安全性和隱私保護的三重優(yōu)勢，用戶無需擔(dān)心攝像頭數(shù)據(jù)被傳到云端或被第三方訪問。

陳羽北坦言，目前真正的設(shè)備端AI革命尚未到來，但市場熱度比之前更高，從產(chǎn)品化、落地和客戶需求來看，進入真實產(chǎn)品場景的數(shù)量正在增多。未來發(fā)展的關(guān)鍵在于更多剛需應(yīng)用的出現(xiàn)，如智能手表的語音能力、嬰兒監(jiān)控攝像頭等，這些應(yīng)用能夠培養(yǎng)用戶習(xí)慣，且注重隱私保護，將AI能力放到本地。

他還提到，當(dāng)前行業(yè)對AI模型訓(xùn)練人才和算力的需求依然極高，華人工程師在AI浪潮中扮演了關(guān)鍵角色。這源于他們的優(yōu)勢——數(shù)理基礎(chǔ)好、工作努力、學(xué)習(xí)新技術(shù)速度快、解決工程類問題能力強，在既定賽道發(fā)展較快。相比之下，美國頂尖工程師也有自己的特長，他們的思想更自由，更敢于打破常規(guī)想象，在創(chuàng)造新路線方面更具創(chuàng)新思考能力。

更多>同類內(nèi)容