在北航的校園里,有一位年輕學(xué)子以其卓越的學(xué)術(shù)成就和開源項(xiàng)目的巨大影響力,成為了人工智能領(lǐng)域的璀璨新星,他就是計(jì)算機(jī)學(xué)院2022級(jí)博士研究生鄭耀威。
自高中時(shí)期被谷歌AlphaGo擊敗人類世界冠軍的新聞所吸引,鄭耀威便立志投身于人工智能領(lǐng)域。考入北航后,他迅速展現(xiàn)出了對(duì)知識(shí)的渴望和科研的熱情。大一期間,他利用課余時(shí)間自學(xué)了Python、概率論、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等多門專業(yè)課程,累計(jì)課時(shí)超過(guò)800小時(shí),為日后的科研之路打下了堅(jiān)實(shí)的基礎(chǔ)。
大二時(shí),鄭耀威主動(dòng)加入張日崇教授的科研團(tuán)隊(duì),開始了自己的科研創(chuàng)新之旅。他堅(jiān)持每天進(jìn)步一點(diǎn)點(diǎn),從跑實(shí)驗(yàn)、讀代碼做起,逐漸深入到科研的核心領(lǐng)域。在本科二年級(jí)的暑假,他選擇留??蒲?,每天沉浸在實(shí)驗(yàn)室的討論、建模與調(diào)試中,這段經(jīng)歷讓他收獲頗豐。
“博觀而約取,厚積而薄發(fā)”是鄭耀威的人生信條。他心無(wú)旁騖地鉆研科研問(wèn)題,與導(dǎo)師和高年級(jí)同學(xué)頻繁碰撞思想,不斷激發(fā)靈感與創(chuàng)新思維。憑借在低資源場(chǎng)景機(jī)器學(xué)習(xí)技術(shù)領(lǐng)域的深入研究,他以第一作者身份在ACL、CVPR、AAAI、WWW等國(guó)際頂級(jí)會(huì)議上發(fā)表了多篇高水平學(xué)術(shù)論文,其中學(xué)生一作的論文就有6篇,谷歌學(xué)術(shù)引用量超過(guò)600次,第一作者論文引用量更是超過(guò)500次。
除了學(xué)術(shù)研究,鄭耀威還積極參與各類課外科技競(jìng)賽。他提出的“基于語(yǔ)法圖上隨機(jī)游走的多方面情感分類”算法,榮獲北航馮如杯科技競(jìng)賽一等獎(jiǎng)。在全國(guó)數(shù)字健康創(chuàng)新應(yīng)用大賽中,他開發(fā)的自動(dòng)檢查心腦血管疾病算法脫穎而出,榮獲算法模型一等獎(jiǎng)。他還獲得了全國(guó)大學(xué)生冰壺人工智能挑戰(zhàn)賽總冠軍、藍(lán)橋杯信息技術(shù)大賽全國(guó)一等獎(jiǎng)等眾多獎(jiǎng)項(xiàng),展現(xiàn)了北航學(xué)子的卓越風(fēng)采。
然而,鄭耀威的成就遠(yuǎn)不止于此。他敏銳地察覺(jué)到大模型微調(diào)和推理資源消耗巨大的問(wèn)題,阻礙了AI的落地應(yīng)用。為此,他將研究重心放在了大模型微調(diào)框架上,成功實(shí)現(xiàn)了大語(yǔ)言模型的量化和低秩分解技術(shù),大幅降低了模型的顯存消耗和訓(xùn)練成本。依托這一技術(shù),他構(gòu)建了大模型高效微調(diào)框架LLaMA-Factory,并開源至GitHub平臺(tái)。
LLaMA-Factory項(xiàng)目一經(jīng)提出就受到了廣泛關(guān)注,社區(qū)開發(fā)者的需求紛至沓來(lái)。鄭耀威不斷學(xué)習(xí)各類型號(hào)硬件平臺(tái)文檔,實(shí)現(xiàn)了硬件感知的自動(dòng)優(yōu)化方案,使LLaMA-Factory在英偉達(dá)芯片和國(guó)產(chǎn)芯片上均能無(wú)痛運(yùn)行。這一貢獻(xiàn)贏得了華為昇騰芯片部門官方的高度認(rèn)可,他也因此榮獲華為昇騰生態(tài)開源卓越貢獻(xiàn)獎(jiǎng)。
在鄭耀威的不懈努力下,LLaMA-Factory項(xiàng)目逐漸贏得了社區(qū)開發(fā)者的廣泛贊譽(yù)與熱烈歡迎。項(xiàng)目累計(jì)獲得超過(guò)40000星標(biāo),成為了國(guó)內(nèi)最熱門的大語(yǔ)言模型微調(diào)框架,并登頂Github熱門項(xiàng)目榜單全球第一。他還多次受邀參加行業(yè)峰會(huì)、開發(fā)者大會(huì),與全球各地的LLaMA-Factory用戶面對(duì)面交流,共同探討技術(shù)難題。
鄭耀威積極將學(xué)術(shù)成果與社會(huì)應(yīng)用緊密結(jié)合。他介紹了LLaMA-Factory在山西文旅AI導(dǎo)游場(chǎng)景中的實(shí)際應(yīng)用,還與業(yè)界大咖共話DeepSeek帶來(lái)的AI應(yīng)用加速創(chuàng)新。他的開源精神和技術(shù)實(shí)力得到了業(yè)界的廣泛認(rèn)可。
對(duì)于自己的成長(zhǎng)過(guò)程,鄭耀威尤為感謝身邊老師的支持。他回憶起在項(xiàng)目受挫時(shí),導(dǎo)師張日崇教授花一整天陪他一起分析代碼、逐句討論論文的經(jīng)歷,至今仍銘記在心。他也希望更多同學(xué)能夠走進(jìn)創(chuàng)新,用好大模型,通過(guò)參與開源社區(qū)的形式接觸前沿技術(shù),與學(xué)者碰撞觀點(diǎn)。