在人工智能領域,多模態(tài)模型的發(fā)展正成為行業(yè)焦點。智象未來CEO梅濤近日在接受采訪時透露,該公司正在研發(fā)全球僅有的三家具備千億規(guī)模參數(shù)的多模態(tài)模型之一。他強調,缺乏強大的基礎模型支撐,具身智能技術難以實現(xiàn)跨場景的泛化應用,即便在特定領域通過數(shù)據(jù)采集取得進展,也難以復制到其他場景。
針對視頻生成技術的商業(yè)化前景,梅濤表現(xiàn)出強烈信心。他指出,隨著英偉達等芯片廠商持續(xù)迭代產品,算力成本正以每年5-10倍的性能提升速度下降,而價格漲幅有限,這為AI視頻技術落地創(chuàng)造了基礎條件。今年以來,AI生成的短視頻、電商素材和短劇內容質量已達到商業(yè)可用標準,預計在影視制作、廣告營銷等領域將逐步取代大部分人工創(chuàng)作。
在商業(yè)模式方面,梅濤特別提到企業(yè)級服務的盈利能力。他透露,面向B端的多模態(tài)模型服務毛利率顯著高于消費級市場,且模型Token的利潤率遠超傳統(tǒng)大語言模型。這種成本優(yōu)勢源于多模態(tài)數(shù)據(jù)處理的復雜性和技術壁壘,使得具備核心算法能力的企業(yè)能夠建立競爭護城河。
據(jù)技術資料顯示,智象未來近期推出的HiDream-O1-Image-Pro圖像大模型已展現(xiàn)技術實力。該模型采用原生全模態(tài)架構,參數(shù)量突破2000億級,在圖像生成質量、語義理解等核心指標上刷新多項行業(yè)紀錄。這款產品的發(fā)布,標志著多模態(tài)技術從實驗室研究向規(guī)模化應用邁出關鍵一步。















