在2025年中國(guó)家電及消費(fèi)電子博覽會(huì)(AWE2025)上,實(shí)時(shí)互動(dòng)云服務(wù)商聲網(wǎng)推出了全新的對(duì)話式AI開發(fā)套件,并宣布將這一套件軟硬件全面開源,為開發(fā)者提供了全新的機(jī)遇。
聲網(wǎng)此次推出的對(duì)話式AI開發(fā)套件,是基于博通集成(Beken)的高性能AI芯片BK7258,結(jié)合聲網(wǎng)深度優(yōu)化的對(duì)話式AI引擎,打造出的完整端側(cè)實(shí)時(shí)交互系統(tǒng)。這一系統(tǒng)旨在為開發(fā)者提供從“對(duì)話式AI”到“智能硬件開發(fā)”的一站式解決方案。
聲網(wǎng)的對(duì)話式AI開發(fā)套件,憑借語音活動(dòng)檢測(cè)(VAD)、實(shí)時(shí)語音混合、智能打斷處理等技術(shù)和方案,展現(xiàn)了五大顯著優(yōu)勢(shì)。首先,AI對(duì)話體驗(yàn)接近真人交互,延遲低至650ms,打斷響應(yīng)更是低至340ms,即使在復(fù)雜環(huán)境下也能準(zhǔn)確識(shí)別用戶指令。其次,套件支持多模態(tài)交互,提供豐富的接口,支持文本、視頻、觸控等多種方式,滿足多樣化需求。
聲網(wǎng)的對(duì)話式AI開發(fā)套件兼容國(guó)內(nèi)主流的AI大模型,如通義千問、豆包、DeepSeek等,同時(shí)也可接入開發(fā)者自研的大模型,提供了更多的選擇和自由。這一特性極大地降低了開發(fā)者的成本,無需再投入高昂的資金自研AI大模型。
在產(chǎn)品開發(fā)周期方面,聲網(wǎng)表示,開發(fā)者只需下載開源代碼,即可將AI能力集成到硬件設(shè)備中,1小時(shí)就能跑通Demo,1天即可完成產(chǎn)品原型送樣,極大地縮短了產(chǎn)品開發(fā)周期,降低了成本。
另一大優(yōu)勢(shì)在于極低的功耗,聲網(wǎng)采用了低功耗設(shè)計(jì)方案,使得對(duì)話式AI開發(fā)套件可以實(shí)現(xiàn)超長(zhǎng)待機(jī),解決了移動(dòng)便攜類產(chǎn)品的續(xù)航焦慮,進(jìn)一步擴(kuò)大了其適用范圍。
在應(yīng)用場(chǎng)景上,聲網(wǎng)提到了AI玩具、AI教育硬件、AI陪伴設(shè)備、家庭語音助手、穿戴設(shè)備個(gè)人助手等多個(gè)領(lǐng)域。其中,AI玩具和AI陪伴設(shè)備以其獨(dú)特的陪伴功能受到廣泛關(guān)注,特別是在今年的CES和AWE大會(huì)上,陪伴機(jī)器人成為各大企業(yè)展示的亮點(diǎn),展現(xiàn)了這一行業(yè)的巨大前景。
聲網(wǎng)透露,2024年全球AI玩具市場(chǎng)規(guī)模已達(dá)到181億美元,預(yù)計(jì)2033年將達(dá)到600億美元。例如,AI情感陪伴機(jī)器人初創(chuàng)公司珞博Robopoet發(fā)布的口袋AI毛絨寵物Fuzzoo,就搭載了聲網(wǎng)的對(duì)話式AI技術(shù),為用戶提供了個(gè)性化的交互體驗(yàn)。
隨著供應(yīng)鏈的逐漸成熟,具身智能正逐步融入我們的生活。無論是機(jī)器人還是配備了各類傳感器的家電設(shè)備,關(guān)鍵在于能夠準(zhǔn)確接收用戶的語音指令,并通過AI大模型解析和執(zhí)行任務(wù)。聲網(wǎng)對(duì)話式AI開發(fā)套件的全面開源,意味著有志于具身智能行業(yè)的企業(yè)能夠以低成本、快速為產(chǎn)品加入AI對(duì)話能力。
聲網(wǎng)提供的這一平臺(tái),不僅支持自由接入傳感器和大模型,還為開發(fā)者提供了極高的自由度。開發(fā)者可以基于聲網(wǎng)提供的平臺(tái),快速適配自家的硬件設(shè)備,從而加速產(chǎn)品的開發(fā)和落地。