在直播行業(yè)蓬勃發(fā)展的當(dāng)下,1.8億實(shí)名開播賬號與3880萬名職業(yè)主播的規(guī)模背后,是千億級終端需求的明確市場。然而,行業(yè)長期面臨“手機(jī)直播畫質(zhì)不足、PC專業(yè)直播操作復(fù)雜且成本高昂”的雙重困境。針對這一痛點(diǎn),科技企業(yè)易思態(tài)(EastAI)憑借五年軟硬一體技術(shù)研發(fā)積累,推出以“All-in-One硬件+AI專業(yè)導(dǎo)播+SaaS增值服務(wù)”為核心的三位一體解決方案,聯(lián)合阿里云千問系列大模型能力,打造AI直播一體機(jī)及多品類智能終端,為直播、會議、教育等場景提供高效智能的技術(shù)支撐。
作為端側(cè)AI技術(shù)創(chuàng)新的先行者,易思態(tài)的技術(shù)覆蓋操作系統(tǒng)改造、音視頻處理、模型端側(cè)部署等關(guān)鍵領(lǐng)域。經(jīng)過1800余天研發(fā)、17套平臺方案優(yōu)化、32次固件迭代,并通過3000余家硬件付費(fèi)客戶的驗(yàn)證,其首款量產(chǎn)產(chǎn)品P9 Max直播一體機(jī)正式落地。該設(shè)備在硬件層面搭載索尼IMX766大底傳感器,配備5000萬像素全像素全向?qū)辜夹g(shù),從底層重構(gòu)影像、音頻、顯示三大系統(tǒng),直播畫質(zhì)可媲美蘋果前置攝像頭。接口方面,支持HDMI IN/OUT、USB3.0、全功能Type-C等全協(xié)議覆蓋,兼容微單、無人機(jī)等專業(yè)設(shè)備,無需外設(shè)即可搭建復(fù)雜直播間。
軟件體驗(yàn)上,全自研iDaobo智能導(dǎo)播系統(tǒng)將專業(yè)功能簡化至“一屏操作”:美顏、機(jī)位切換、調(diào)音等核心功能三步完成,零基礎(chǔ)用戶1分鐘即可開播。其背后依托阿里云視頻大模型萬相的深度賦能:AI提詞器通過FunASR端側(cè)ASR技術(shù)實(shí)現(xiàn)“字隨音走”,解決主播忘詞難題;直播間背景視頻借助萬相模型自動生成首尾幀銜接循環(huán),無需專業(yè)團(tuán)隊(duì)即可打造沉浸式動態(tài)場景。翻譯功能支持跨境直播的雙向同傳,實(shí)現(xiàn)“主播說中文、觀眾聽英文、彈幕雙語同步”,打破跨文化交流壁壘。
在生態(tài)構(gòu)建方面,易思態(tài)以“技術(shù)落地+生態(tài)共建”為理念,將端側(cè)AI音視頻技術(shù)延伸至?xí)h、通話等場景。在阿里云通義智能硬件展上,其通過實(shí)景AI直播間展示技術(shù)實(shí)力:P9 Max與阿里云無影數(shù)字人方案深度兼容,生態(tài)伙伴可快速落地?cái)?shù)字人直播服務(wù),覆蓋虛擬主播生成、多語種播報(bào)、實(shí)時(shí)互動等全流程。目前,已有企業(yè)借助該方案推出數(shù)字人直播一體機(jī),應(yīng)用于電商帶貨、本地生活等領(lǐng)域,顯著降低運(yùn)營成本。
針對開發(fā)者合作,易思態(tài)提供“零開發(fā)接入”“淺層適配(3天上線)”“深度整合”三種模式,開放千問系列大模型技術(shù)能力。例如,品牌客戶“必火智能”通過即插即用模式接入后,服務(wù)的本地生活商家月均曝光量提升超30萬;數(shù)字人企業(yè)“開飛秒創(chuàng)”經(jīng)淺層適配后,3天內(nèi)完成多平臺數(shù)據(jù)對接,實(shí)現(xiàn)場景全覆蓋。在AI直播托管場景中,生態(tài)伙伴集成百聆大模型語義理解與TTS技術(shù),實(shí)現(xiàn)直播內(nèi)容自動生成、主播聲音定制化播報(bào),推動“無人值守直播”精準(zhǔn)觸達(dá)目標(biāo)用戶。
易思態(tài)聯(lián)合合作伙伴推出雙向同聲傳譯耳機(jī)、雙屏翻譯機(jī)、同傳手機(jī)等創(chuàng)新產(chǎn)品。耳機(jī)通過藍(lán)牙協(xié)議改造支持全場景雙向同傳;雙屏翻譯機(jī)采用Gummy+Qwen-mt-plus雙模型,適配酒店、展會等場景的實(shí)時(shí)對話需求;同傳手機(jī)兼容所有通話、社交、會議類APP,全面支持遠(yuǎn)程溝通。這些產(chǎn)品均深度融合千問系列大模型能力,推動AI音頻應(yīng)用融入日常生態(tài)。
目前,易思態(tài)已形成toB與toC并行的商業(yè)模式:面向企業(yè)提供“PCBA+License”、純License、整機(jī)貼牌等服務(wù),通過“硬件為基、軟件為魂、生態(tài)為翼”的發(fā)展格局,持續(xù)推動端側(cè)AI音視頻技術(shù)落地,助力產(chǎn)業(yè)升級與生活便利化。















