在科技日新月異的今天,淘天集團(tuán)憑借其在AI領(lǐng)域的深度布局,正逐步成為業(yè)界的焦點。近日,該集團(tuán)詳細(xì)揭示了其AIGX技術(shù)體系及大模型家族的最新進(jìn)展,這一系列技術(shù)突破迅速吸引了外界的廣泛關(guān)注。
據(jù)統(tǒng)計,過去五年間,淘天集團(tuán)在國際頂級學(xué)術(shù)會議上發(fā)表的論文數(shù)量已突破300篇大關(guān),彰顯了其在AI研究領(lǐng)域的深厚底蘊。同時,其阿里媽媽團(tuán)隊在技術(shù)創(chuàng)新上同樣不遺余力,已申請中國專利超過130項,其中20余項已成功獲得授權(quán)。
不僅如此,淘天集團(tuán)還積極擁抱開源文化,已有多個AI項目面向全球開發(fā)者開放。這些項目在開源社區(qū)中表現(xiàn)搶眼,多個模型更是穩(wěn)居趨勢榜前列,贏得了業(yè)界的廣泛贊譽。
尤為在即將舉行的NeurIPS 2024大會上,淘天集團(tuán)阿里媽媽團(tuán)隊將開源一項具有里程碑意義的技術(shù)——AuctionNet。作為全球首個標(biāo)準(zhǔn)化的自動出價Benchmark,AuctionNet數(shù)據(jù)集涵蓋了48個不同出價智能體的競價日志,總計5億條記錄,數(shù)據(jù)量高達(dá)80GB。這一技術(shù)的推出,不僅將極大地推動廣告拍賣中出價決策算法的研究,還將為大型博弈場景的決策智能算法提供有力支持。在NeurIPS 2024競賽中,AuctionNet已成功應(yīng)用,為1500支參賽隊伍提供了精準(zhǔn)的算法效果評估,助力他們開發(fā)出更多元、更具創(chuàng)新性的解決方案。
在智能創(chuàng)意領(lǐng)域,淘寶天貓同樣表現(xiàn)不俗。去年,該平臺開源了多個項目,其中包括基于FLUX的配套模型ControlNet圖像修復(fù)模型和Turbo模型。這兩個模型可相互兼容,配合使用能夠大幅提升圖像修復(fù)速度。自開源以來,它們迅速獲得了開源社區(qū)的積極反饋,并在HuggingFace社區(qū)趨勢榜上名列前茅。
在ChatGPT掀起大模型浪潮的背景下,淘天集團(tuán)也緊跟時代步伐。去年9月,該集團(tuán)聯(lián)合愛橙科技開源了大模型訓(xùn)練框架Megatron-LLaMA。這一框架的推出,使得開發(fā)者們能夠更便捷地提升大語言模型的訓(xùn)練性能,同時降低訓(xùn)練成本,并保持與LLaMA社區(qū)的兼容性。測試結(jié)果顯示,在32卡訓(xùn)練環(huán)境下,Megatron-LLaMA相比HuggingFace上的直接代碼版本,能夠?qū)崿F(xiàn)176%的加速。在大規(guī)模訓(xùn)練場景下,Megatron-LLaMA更是展現(xiàn)出了近乎線性的擴(kuò)展性,并對網(wǎng)絡(luò)不穩(wěn)定表現(xiàn)出極高的容忍度。
一直以來,淘寶天貓都秉持著開源共享的理念,與業(yè)界共同分享AI技術(shù)的紅利。除了上述項目外,該平臺還開源了包括DIN(深度興趣網(wǎng)絡(luò))、XDL(阿里自研深度學(xué)習(xí)框架)、EULER(分布式高性能圖表示學(xué)習(xí)框架)、CLF(曲率空間學(xué)習(xí)框架)、EFLS(聯(lián)邦學(xué)習(xí)解決方案)等在內(nèi)的眾多AI模型和平臺,為AI技術(shù)的發(fā)展貢獻(xiàn)了自己的力量。
面對AI電商的蓬勃發(fā)展態(tài)勢,淘天集團(tuán)也在持續(xù)加大AI領(lǐng)域技術(shù)人才的儲備力度。據(jù)相關(guān)報道,過去兩年間,該集團(tuán)啟動了多輪校招活動,技術(shù)類崗位的占比持續(xù)增加。同時,集團(tuán)還連續(xù)兩年發(fā)起了T-Star全球頂尖技術(shù)人才計劃,以定制化培養(yǎng)和百萬年薪等優(yōu)厚待遇吸引全球頂尖人才加盟。