黄色三级不卡在线观看-男男视频网站高清观看-久久国产欧美韩国精品app-免费观看妇女A级视频-中文字幕一区二区三区人妻在线视频-国产精选av一区二区-欧美亚洲精品不卡一区二区-99女福利女女视频在线播放-国产美女香蕉久久精品

  • 虎科技 - 領(lǐng)先的互聯(lián)網(wǎng)科技媒體

阿里開源Qwen-Image-Layered圖像模型,開啟AI圖層精準(zhǔn)編輯新紀(jì)元

   時間:2025-12-23 04:19 來源:快訊作者:趙云飛

阿里近日正式開源全新圖像生成模型Qwen-Image-Layered,該模型首次在架構(gòu)層面實現(xiàn)了類似Photoshop的圖層理解能力,標(biāo)志著視覺大模型從"像素堆砌"向"空間重組"的重大突破。這一創(chuàng)新技術(shù)通過引入分層處理機(jī)制,使AI生成圖像的可編輯性達(dá)到專業(yè)設(shè)計工具水準(zhǔn),有望重塑數(shù)字內(nèi)容創(chuàng)作流程。

傳統(tǒng)視覺大模型長期面臨"扁平化認(rèn)知"困境,其處理圖像時將所有元素視為緊密耦合的像素矩陣,難以理解物體間的空間關(guān)系。這種局限導(dǎo)致圖像編輯如同"開盲盒"——修改某個元素往往引發(fā)全局變化,例如移動畫中貓咪時,背景紋理會完全重構(gòu)而非自然填補(bǔ)。這種不可控性嚴(yán)重制約了AI在商業(yè)廣告、UI設(shè)計、影視后期等需要精準(zhǔn)控制的場景應(yīng)用。

Qwen-Image-Layered通過三項核心技術(shù)突破解決這一難題。首先研發(fā)團(tuán)隊自研RGBA-VAE編碼體系,在傳統(tǒng)RGB色彩模式基礎(chǔ)上新增Alpha透明度通道,使模型具備圖層分離能力。其次創(chuàng)新的VLD-MMDiT架構(gòu)配合3D位置編碼技術(shù),讓AI能自動推理被遮擋區(qū)域的背景紋理。最關(guān)鍵的是,模型訓(xùn)練階段直接解析海量PSD源文件,學(xué)習(xí)專業(yè)設(shè)計師的分層邏輯,形成"空間認(rèn)知"本能。

實測顯示,該模型可實現(xiàn)近乎零誤差的圖層編輯:設(shè)計師能獨立調(diào)整特定圖層元素的位置、尺寸甚至重新繪制,而其他圖層保持完全不變。這種"內(nèi)在可編輯性"徹底改變了創(chuàng)作模式——以往需要數(shù)小時的精細(xì)摳圖工作,現(xiàn)在通過AI原生支持即可瞬間完成。某動畫工作室測試表明,使用新模型后角色動畫制作效率提升40%,背景修改耗時從平均2.3小時縮短至8分鐘。

Qwen-Image-Layered分層處理機(jī)制示意圖

技術(shù)開源方面,該模型已在魔搭社區(qū)和HuggingFace平臺全面開放,支持商業(yè)用途免費下載。此舉延續(xù)了阿里在開源領(lǐng)域的領(lǐng)先布局——截至目前,千問系列已開源近400個模型,全球下載量突破7億次,衍生開發(fā)模型超18萬個。在企業(yè)服務(wù)市場,通義大模型以超百萬家客戶規(guī)模占據(jù)中國企業(yè)級市場首位,成為應(yīng)用最廣泛的國產(chǎn)大模型。

行業(yè)分析師指出,Qwen-Image-Layered的分層處理能力將引發(fā)連鎖反應(yīng):設(shè)計工具可能向AI原生架構(gòu)轉(zhuǎn)型,數(shù)字內(nèi)容生產(chǎn)流程面臨重構(gòu),甚至催生新的創(chuàng)作職業(yè)形態(tài)。隨著模型在影視、游戲、廣告等領(lǐng)域的深度滲透,專業(yè)設(shè)計工具的市場格局或?qū)⒂瓉硇乱惠喯磁啤?/p>

 
 
更多>同類內(nèi)容
推薦圖文
推薦內(nèi)容
點擊排行
 
智快科技微信賬號
ITBear微信賬號

微信掃一掃
加微信拉群
電動汽車群
科技數(shù)碼群