阿里巴巴近日宣布推出全新升級的視頻生成模型HappyHorse1.1,在動態表現、主體穩定性、指令理解、視覺效果和音頻處理等多個維度實現顯著突破。該版本針對1.0版本存在的畫面動作遲緩、節奏感不足等問題,通過優化運動建模算法和時序一致性技術,使生成視頻的動作連貫性和力量感得到大幅提升,尤其在打斗、運動等高強度場景中表現更為流暢自然。
針對內容創作者普遍關注的主體一致性難題,1.1版本創新支持同時輸入9張角色參考圖,通過增強的多分鏡理解能力和N宮格參考技術,確保商品細節、品牌元素、角色特征與場景組合的穩定性。這一改進使得多角色短劇、直播帶貨、廣告制作等場景中"角色變臉"的概率大幅降低,創作效率顯著提升。據測試,在復雜場景中,模型對角色特征的保持準確率較前代提升超過40%。
在指令理解方面,新版本展現出更強的語義解析能力。無論是簡短的描述性指令還是復雜的多層次敘事,模型都能精準捕捉核心要素。對于打斗等動態場景,僅需"兩人對打"等簡潔提示即可生成符合預期的畫面;面對復雜指令時,鏡頭切換的穩定性和多角色互動的連貫性得到明顯優化,能夠高質量完成跨場景敘事任務。
視覺與聽覺體驗的升級成為本次迭代的另一亮點。通過專項優化算法,模型有效解決了前代用戶反饋的"油光過重""過度銳化"等問題,在保留皮膚紋理、毛孔等真實細節的同時,使畫面質感更符合影視級標準。音頻處理方面,臺詞生成系統實現動態語調調整,可根據場景情緒自動匹配語速、停頓和語氣,并支持在提示詞中指定背景音效和環境聲,為創作者提供更豐富的聲音設計空間。
技術參數方面,HappyHorse1.1延續了前代3-15秒的單次生成時長,支持720p/1080p分辨率輸出及自由寬高比設置。自上線以來,該模型已廣泛應用于短劇制作、電商廣告、品牌營銷、游戲CG等多個領域,累計服務超過2000家內容機構。目前,阿里巴巴正與虎鯨文娛集團聯合舉辦"Horsepower"AI影像創作大賽,設立百萬級商業合作獎勵,由知名導演張紀中等業內專家組成評審團,創作者可通過官方平臺提交作品參賽。















