在AI領(lǐng)域的一次重大突破中,DeepSeek R1蒸餾模型的推出標志著行業(yè)邁向了全新的發(fā)展階段。這一新一代終端側(cè)推理模型,其性能卓越,讓以往僅在云端才能實現(xiàn)的AI功能得以在終端設(shè)備上展現(xiàn),預示著終端側(cè)AI處理新時代的到來,既安全又可靠。
高通技術(shù)公司近期發(fā)布的白皮書《AI變革推動終端側(cè)推理創(chuàng)新》,深入剖析了DeepSeek R1發(fā)布背后的AI行業(yè)大趨勢。隨著訓練成本的降低、推理部署的加速以及對邊緣環(huán)境創(chuàng)新的關(guān)注,AI領(lǐng)域正經(jīng)歷深刻變革。科技界不再僅僅專注于構(gòu)建更大的模型,而是轉(zhuǎn)向如何在邊緣側(cè)實際應(yīng)用中高效部署這些模型。大型基礎(chǔ)模型的蒸餾技術(shù)催生了眾多更智能、更小巧、更高效的模型,為各行業(yè)尤其是終端側(cè)AI的快速集成提供了可能。
DeepSeek R1作為尖端AI推理模型的代表,其一經(jīng)發(fā)布便在科技界掀起波瀾。其性能不僅與同類先進模型相當,甚至在某些方面超越,徹底顛覆了AI發(fā)展的傳統(tǒng)觀念。這一關(guān)鍵時刻是行業(yè)創(chuàng)新趨勢的一部分,展現(xiàn)了在打造高質(zhì)量小語言模型和多模態(tài)推理模型方面的進展,以及這些創(chuàng)新如何為AI的商用應(yīng)用和終端側(cè)推理落地鋪平道路。
當前,四大趨勢正顯著提升終端側(cè)運行的AI模型的質(zhì)量、性能和效率。首先,先進的AI小模型已具備出色性能,新技術(shù)如模型蒸餾和創(chuàng)新AI網(wǎng)絡(luò)架構(gòu)能夠在不影響質(zhì)量的前提下簡化開發(fā)流程,使新模型的表現(xiàn)超越一年前僅在云端運行的大型模型。其次,模型參數(shù)規(guī)模迅速縮小,得益于先進的量化和剪枝技術(shù),開發(fā)者能夠在不犧牲準確性的前提下減小模型規(guī)模。再者,邊緣側(cè)應(yīng)用日益豐富,高質(zhì)量AI模型的激增使得文本摘要、編程助手、實時翻譯等功能在智能手機等終端設(shè)備上普及,為AI在邊緣側(cè)的規(guī)?;渴鹛峁┝松逃脩?yīng)用支持。最后,AI正成為新的用戶界面,個性化多模態(tài)AI智能體將簡化交互,高效跨越不同應(yīng)用完成任務(wù)。
高通技術(shù)公司在AI訓練向大規(guī)模推理轉(zhuǎn)型以及AI計算處理從云端向邊緣側(cè)擴展方面擁有戰(zhàn)略優(yōu)勢。公司在定制CPU、NPU、GPU和低功耗子系統(tǒng)開發(fā)方面取得了顯著成就。通過與模型開發(fā)商合作,并提供面向不同邊緣終端領(lǐng)域的模型部署工具、框架和SDK,高通技術(shù)公司助力開發(fā)者在邊緣側(cè)加速采用AI智能體和應(yīng)用。
近期,AI模型訓練方式的顛覆性變革和重新評估進一步驗證了AI格局向大規(guī)模推理轉(zhuǎn)變的趨勢,這將開啟全新的邊緣側(cè)推理計算創(chuàng)新和升級周期。盡管模型訓練仍將在云端進行,但推理將受益于高通技術(shù)廣泛終端的采用,從而催生更多邊緣側(cè)AI賦能處理器的需求。
高通公司總裁兼CEO安蒙在2025財年第一季度財報電話會議中分享了對當前AI行業(yè)發(fā)展趨勢的看法。他表示,高通在連接、計算和邊緣AI技術(shù)方面的領(lǐng)先組合,持續(xù)保持高度差異化,并在多個行業(yè)中愈發(fā)重要。高通對邊緣側(cè)AI機遇持樂觀態(tài)度,尤其是在迎來新一輪AI創(chuàng)新和規(guī)?;瘮U展周期之際。DeepSeek R1及其他類似模型的推出,展示了AI模型正以更快的速度發(fā)展,變得更小、更強大、更高效,并可直接在終端側(cè)運行。事實上,DeepSeek R1蒸餾模型在發(fā)布僅幾天內(nèi)便能在搭載驍龍平臺的智能手機和PC上運行。
安蒙還提到,隨著進入AI推理時代,模型訓練仍將在云端進行,但推理將越來越多地在終端側(cè)運行,使AI更加便捷、可定制且高效。這將促進更多專用模型和應(yīng)用的開發(fā)和采用,從而推動各類終端對高通平臺的需求。憑借行業(yè)最強大和高效的邊緣側(cè)AI處理器,高通在推動這一轉(zhuǎn)型方面具有獨特優(yōu)勢,并將從即將到來的變革中受益。