黄色三级不卡在线观看-男男视频网站高清观看-久久国产欧美韩国精品app-免费观看妇女A级视频-中文字幕一区二区三区人妻在线视频-国产精选av一区二区-欧美亚洲精品不卡一区二区-99女福利女女视频在线播放-国产美女香蕉久久精品

  • 虎科技 - 領(lǐng)先的互聯(lián)網(wǎng)科技媒體

快手可靈視頻O1模型全量登場(chǎng):統(tǒng)一多模態(tài),開(kāi)啟視頻創(chuàng)作新體驗(yàn)

   時(shí)間:2025-12-03 01:19 來(lái)源:快訊作者:陸辰風(fēng)

可靈AI近日通過(guò)官方公眾號(hào)正式宣布,其自主研發(fā)的全球首款統(tǒng)一多模態(tài)視頻生成模型——可靈視頻O1已面向全體用戶(hù)開(kāi)放使用。這一突破性成果標(biāo)志著視頻生成領(lǐng)域進(jìn)入全新階段,通過(guò)整合多模態(tài)交互能力,實(shí)現(xiàn)了從單一功能到綜合創(chuàng)作的跨越式升級(jí)。

據(jù)技術(shù)白皮書(shū)披露,該模型創(chuàng)新性采用生成式架構(gòu)底座,通過(guò)多模態(tài)視覺(jué)語(yǔ)言(MVL)交互框架,將圖像生成、視頻創(chuàng)作、文本理解等任務(wù)整合至統(tǒng)一輸入界面。用戶(hù)無(wú)需切換不同功能模塊,僅需在單一對(duì)話框中輸入混合指令,即可同步完成主體構(gòu)建、場(chǎng)景渲染與細(xì)節(jié)優(yōu)化。例如輸入"生成一位穿紅色漢服的女子在古風(fēng)庭院中彈奏古箏的視頻,要求鏡頭從全景推近至特寫(xiě)",系統(tǒng)可自動(dòng)解析多維度要求并生成連貫畫(huà)面。

核心技術(shù)創(chuàng)新方面,模型引入的思維鏈(Chain-of-thought)技術(shù)顯著提升了內(nèi)容邏輯性。通過(guò)模擬人類(lèi)推理過(guò)程,系統(tǒng)能夠理解"雨天打傘"與"地面水漬"的因果關(guān)系,或"運(yùn)動(dòng)員起跑"與"觀眾反應(yīng)"的時(shí)間順序。官方測(cè)試數(shù)據(jù)顯示,在復(fù)雜場(chǎng)景的事件推演任務(wù)中,模型準(zhǔn)確率較前代提升67%,尤其在多主體交互場(chǎng)景中展現(xiàn)出更強(qiáng)的語(yǔ)義理解能力。

創(chuàng)作界面同步迎來(lái)重大升級(jí),新版本支持通過(guò)自然語(yǔ)言對(duì)話調(diào)整畫(huà)面參數(shù)。用戶(hù)可實(shí)時(shí)修改"主體服飾顏色""背景光影效果"等200余項(xiàng)細(xì)節(jié),系統(tǒng)將自動(dòng)生成多版本方案供選擇。針對(duì)專(zhuān)業(yè)創(chuàng)作者,平臺(tái)還開(kāi)放了鏡頭運(yùn)動(dòng)控制、幀率調(diào)節(jié)等高級(jí)功能,滿足從短視頻創(chuàng)作到影視級(jí)制作的不同需求。

在主體一致性控制方面,模型通過(guò)三維空間建模技術(shù)實(shí)現(xiàn)了跨鏡頭穩(wěn)定表現(xiàn)。即使經(jīng)歷"從遠(yuǎn)景到特寫(xiě)"或"360度環(huán)繞拍攝"等極端視角變化,主體特征仍能保持高度一致。測(cè)試案例顯示,在連續(xù)200幀的復(fù)雜運(yùn)鏡中,人物面部特征識(shí)別誤差率低于0.3%,衣物褶皺、配飾細(xì)節(jié)等微觀元素亦能精準(zhǔn)復(fù)現(xiàn)。該技術(shù)已應(yīng)用于影視預(yù)告片制作、虛擬偶像直播等多個(gè)商業(yè)化場(chǎng)景。

 
 
更多>同類(lèi)內(nèi)容
推薦圖文
推薦內(nèi)容
點(diǎn)擊排行
 
智快科技微信賬號(hào)
ITBear微信賬號(hào)

微信掃一掃
加微信拉群
電動(dòng)汽車(chē)群
科技數(shù)碼群