99热都是精品|亚洲精品精华液一区|日本综合视频|wallpaper原神18进入|国产农村一国产农村|穿越火线 兰|寡妇的肉体完整版

媒體界 - 推動中國媒體行業(yè)創(chuàng)新,促進(jìn)業(yè)內(nèi)人士交流分享!

清華與快手聯(lián)手:從價值觀切入,讓推薦算法更懂用戶需求促多業(yè)務(wù)增長

   發(fā)布時間:2026-05-30 05:20 作者:馮璃月

在推薦算法領(lǐng)域持續(xù)深耕的當(dāng)下,行業(yè)正積極探索新的增長路徑。短視頻推薦系統(tǒng)歷經(jīng)多年發(fā)展,在協(xié)同過濾、序列推薦、多目標(biāo)優(yōu)化等技術(shù)方向上已取得顯著進(jìn)展。然而,隨著現(xiàn)有技術(shù)體系逐漸成熟,通過優(yōu)化模型結(jié)構(gòu)、開發(fā)常規(guī)特征以及學(xué)習(xí)可觀測目標(biāo)來提升效能的方式,效果日益有限,行業(yè)迫切需要創(chuàng)新的研究思路。

清華大學(xué)經(jīng)濟(jì)管理學(xué)院的研究團(tuán)隊(duì)與快手消費(fèi)策略算法部展開合作,開展了一項(xiàng)頗具創(chuàng)新性的聯(lián)合實(shí)驗(yàn)。該實(shí)驗(yàn)從視頻傳遞的價值觀角度出發(fā),深入探究用戶觀看視頻后的行為和心理變化。研究團(tuán)隊(duì)借助大模型的模擬與推理能力,將社會學(xué)和心理學(xué)領(lǐng)域的價值觀理論引入推薦排序策略,并在快手主站開展了大規(guī)模隨機(jī)在線對比實(shí)驗(yàn)。初步成果顯示,這一研究方向不僅在技術(shù)層面具備可行性,還在用戶使用時長、電商、直播、社交、搜索等多個業(yè)務(wù)維度實(shí)現(xiàn)了同步增長,實(shí)現(xiàn)了推薦系統(tǒng)在社會價值觀層面通過算法滿足用戶需求的創(chuàng)新功能。

將抽象的價值觀概念從理論轉(zhuǎn)化為推薦系統(tǒng)的實(shí)際應(yīng)用,是該項(xiàng)目的核心挑戰(zhàn)之一。研究團(tuán)隊(duì)基于前期合作成果,分兩個階段構(gòu)建了完整解決方案,即視頻價值的大模型推理以及輕量蒸餾模型線上生效,將離線實(shí)驗(yàn)驗(yàn)證的方法論轉(zhuǎn)化為真實(shí)推薦系統(tǒng)的策略工具。

在大語言模型推理階段,研究團(tuán)隊(duì)利用大語言模型模擬短視頻受眾群體,推理不同類型用戶觀看視頻后的行為和心理變化,進(jìn)而推斷用戶感知到的價值觀。這一推理流程針對隨機(jī)采樣的視頻展開,采樣視頻時間跨度達(dá)6個月,數(shù)量累計(jì)超過650萬條,基本覆蓋了所有類目。

為應(yīng)對每天海量視頻的理解需求,研究團(tuán)隊(duì)進(jìn)一步完成了蒸餾模型的規(guī)模化部署。該模型以快手自研的視頻embedding為特征,以大模型推理結(jié)果為監(jiān)督信號,訓(xùn)練輕量級蒸餾模型。通過這種方式,將大模型強(qiáng)大的受眾模擬和價值觀推理能力遷移到可實(shí)時在線高通量服務(wù)的小模型中,實(shí)現(xiàn)對全量視頻的價值觀標(biāo)簽預(yù)估,從而具備多場景規(guī)模化應(yīng)用的能力。離線測試表明,充分訓(xùn)練后的蒸餾小模型準(zhǔn)確率可達(dá)85%以上,人工評測也認(rèn)為其與大模型推理結(jié)果無明顯差異,滿足線上落地需求。

然而,視頻價值標(biāo)簽預(yù)估結(jié)果在線上推薦系統(tǒng)生效時,面臨新的挑戰(zhàn),即視頻價值與用戶可觀測反饋關(guān)聯(lián)的不確定性。盡管前期離線實(shí)驗(yàn)已驗(yàn)證視頻價值推理結(jié)果能有效提升視頻排序準(zhǔn)確率,但線上真實(shí)場景中用戶反饋信號多樣,包括APP時長、點(diǎn)贊、關(guān)注、打賞、長期留存等,且目前尚無理論論證這些反饋信號與視頻價值的相關(guān)性和互補(bǔ)性。不同推薦業(yè)務(wù)場景下,由于作者生態(tài)和消費(fèi)者群體不同,價值內(nèi)容也存在明顯差異,因此只有通過完整的線上對比試驗(yàn),才能準(zhǔn)確判斷系統(tǒng)隱藏的價值需求和短板。

實(shí)驗(yàn)在快手主站精選頁的重排階段進(jìn)行,采用經(jīng)典A/B實(shí)驗(yàn)范式。實(shí)驗(yàn)規(guī)模為每組約5%流量,覆蓋千萬級用戶群體,實(shí)驗(yàn)周期包括一周的AA期觀察和超過一個月的AB實(shí)驗(yàn)。在實(shí)驗(yàn)干預(yù)方面,每個實(shí)驗(yàn)組在重排階段適度提升某一類價值觀視頻的分發(fā)權(quán)重,觀察對各業(yè)務(wù)指標(biāo)的影響。

初步實(shí)驗(yàn)結(jié)果令人矚目,價值觀調(diào)控對多個業(yè)務(wù)板塊產(chǎn)生了積極影響,且不同價值觀與多業(yè)務(wù)指標(biāo)的關(guān)聯(lián)存在差異。在內(nèi)容消費(fèi)方面,個人安全組顯著提升了用戶APP使用時長及留存指標(biāo);直播業(yè)務(wù)中,多個價值觀組別,如個人安全、傳統(tǒng)、仁慈 - 關(guān)懷等,對直播送禮金額有顯著正向影響;電商業(yè)務(wù)里,享樂主義、個人安全、社會安全等價值觀組別對大盤結(jié)算GMV有明顯正向貢獻(xiàn),買家數(shù)也同步增長;社交互動方面,多個價值觀組別顯著提升了雙關(guān)用戶的內(nèi)容互動與分享行為,改善了平臺社交活躍度;主動搜索方面,大多數(shù)實(shí)驗(yàn)組顯著提升了用戶主動搜索次數(shù),其中刺激類價值觀視頻的提升幅度最為突出。

這一系列實(shí)驗(yàn)結(jié)果背后,蘊(yùn)含著兩個值得深入思考的發(fā)現(xiàn)。其一,供需平衡需求。原有的推薦分發(fā)策略主要以主題作為內(nèi)容的主要表征維度,視頻的價值觀屬性在分發(fā)過程中未被顯式考量。這意味著某些價值觀類型的視頻在平臺上的供給比例可能長期低于用戶的潛在需求,當(dāng)主動提升這類內(nèi)容的分發(fā)權(quán)重時,用戶的正向反饋便會隨之而來。其二,價值觀的行為驅(qū)動力。研究在全體用戶層面統(tǒng)一提升某類價值觀視頻的曝光比例,實(shí)驗(yàn)結(jié)果表明,特定價值觀維度的內(nèi)容在大盤層面更容易激發(fā)用戶的觀看、互動與轉(zhuǎn)化行為。這一發(fā)現(xiàn)將社會心理學(xué)中成熟的價值觀理論與推薦系統(tǒng)的內(nèi)容理解問題相連接,同時也為價值觀理論本身提供了新的經(jīng)驗(yàn)證據(jù),即在數(shù)字內(nèi)容消費(fèi)這一大規(guī)模真實(shí)場景下,不同價值觀類型對人類行為的影響存在因果性、系統(tǒng)性差異,這是以往依賴問卷或小樣本實(shí)驗(yàn)的價值觀研究所難以探討的問題。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容
本欄最新