黄色三级不卡在线观看-男男视频网站高清观看-久久国产欧美韩国精品app-免费观看妇女A级视频-中文字幕一区二区三区人妻在线视频-国产精选av一区二区-欧美亚洲精品不卡一区二区-99女福利女女视频在线播放-国产美女香蕉久久精品

  • 虎科技 - 領(lǐng)先的互聯(lián)網(wǎng)科技媒體

科大訊飛獲語音合成新專利,語氣精準調(diào)控賦能多領(lǐng)域創(chuàng)新應用

   時間:2026-02-11 13:55 來源:ITBEAR作者:鐘景軒

在人工智能技術(shù)持續(xù)突破的背景下,語音合成領(lǐng)域迎來一項重要創(chuàng)新成果??拼笥嶏w股份有限公司近日宣布獲得一項名為“語音合成方法、裝置、電子設備及存儲介質(zhì)”的發(fā)明專利授權(quán),該專利通過引入語氣描述文本的聯(lián)合編碼機制,為語音合成技術(shù)開辟了新的發(fā)展路徑。這項突破性技術(shù)通過將自然語言形式的語氣指令融入模型訓練,使系統(tǒng)能夠精準捕捉并還原語音中的情感、語調(diào)等非語義特征,顯著提升了合成語音的擬人化程度。

專利技術(shù)文檔顯示,該創(chuàng)新方案突破了傳統(tǒng)語音合成僅依賴文本內(nèi)容的局限,通過構(gòu)建雙通道編碼架構(gòu),將語氣描述文本與原始文本進行深度融合。這種設計使系統(tǒng)能夠同時解析語義信息和情感指令,在生成語音時實現(xiàn)語速、音調(diào)、節(jié)奏的動態(tài)調(diào)整。例如在教育場景中,系統(tǒng)可根據(jù)學習者的情緒反饋自動切換鼓勵或嚴肅的語氣,在客服場景中則能通過語調(diào)變化傳遞專業(yè)或親和的服務態(tài)度。

盡管科大訊飛2025年度專利授權(quán)總量較上年下降35.63%至56項,但研發(fā)投入持續(xù)保持增長態(tài)勢。公開數(shù)據(jù)顯示,該公司上半年研發(fā)支出達20.68億元,同比增長6.99%,研發(fā)投入強度維持在行業(yè)領(lǐng)先水平。這種"減量提質(zhì)"的專利策略,反映出企業(yè)從追求數(shù)量向聚焦核心技術(shù)的戰(zhàn)略轉(zhuǎn)型。目前,科大訊飛已構(gòu)建起涵蓋4041項商標、6001項專利、1683項著作權(quán)的立體化知識產(chǎn)權(quán)體系。

在應用生態(tài)建設方面,該技術(shù)已形成多場景落地能力。智能助手領(lǐng)域,系統(tǒng)可根據(jù)用戶歷史交互數(shù)據(jù)建立個性化語音模型;娛樂產(chǎn)業(yè)中,語音合成技術(shù)為虛擬偶像提供自然流暢的對話能力;醫(yī)療場景下,系統(tǒng)通過調(diào)整語氣緩解患者焦慮情緒。據(jù)統(tǒng)計,科大訊飛參與的招投標項目累計達7241次,對外投資企業(yè)133家,形成覆蓋技術(shù)研發(fā)、場景應用、產(chǎn)業(yè)協(xié)同的完整生態(tài)鏈。

行業(yè)分析師指出,這項專利解決了語音合成領(lǐng)域長期存在的情感表達生硬、場景適配性差等痛點。通過將語氣控制從固定參數(shù)升級為自然語言指令,系統(tǒng)可適配更多元化的應用場景。特別是在需要高度情感交互的領(lǐng)域,如心理健康輔導、老年關(guān)懷服務等,該技術(shù)展現(xiàn)出顯著的應用價值。隨著5G和物聯(lián)網(wǎng)設備的普及,語音交互正成為人機交互的主要形態(tài),這類技術(shù)創(chuàng)新將持續(xù)推動行業(yè)邊界拓展。

 
 
更多>同類內(nèi)容
推薦圖文
推薦內(nèi)容
點擊排行
 
智快科技微信賬號
ITBear微信賬號

微信掃一掃
加微信拉群
電動汽車群
科技數(shù)碼群