智譜科技近日正式推出了GLM-4-32B-0414系列AI模型,該系列包含GLM-4-32B-Base-0414、GLM-Z1-32B-0414、GLM-Z1-Rumination-32B-0414以及GLM-Z1-9B-0414四款各具特色的模型,均配備了高達(dá)320億的參數(shù)規(guī)模。
其中,GLM-4-32B-Base-0414模型尤為引人注目。它采用了15T的高質(zhì)量數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練,特別加入了大量推理類(lèi)的合成數(shù)據(jù),顯著提升了模型的推理能力。在后續(xù)的訓(xùn)練階段,通過(guò)拒絕采樣和強(qiáng)化學(xué)習(xí)等先進(jìn)技術(shù)的運(yùn)用,該模型在指令遵循、工程代碼處理、函數(shù)調(diào)用等方面展現(xiàn)出了卓越的性能。在工程代碼生成、Artifacts創(chuàng)造、函數(shù)調(diào)用執(zhí)行、搜索問(wèn)答以及報(bào)告撰寫(xiě)等多個(gè)應(yīng)用場(chǎng)景中,GLM-4-32B-Base-0414的表現(xiàn)甚至可以與更大規(guī)模的模型相媲美。
GLM-Z1-32B-0414則是在基礎(chǔ)模型的基礎(chǔ)上,通過(guò)冷啟動(dòng)技術(shù)和擴(kuò)展強(qiáng)化學(xué)習(xí)的應(yīng)用,以及在數(shù)學(xué)、代碼和邏輯等特定任務(wù)上的深入訓(xùn)練,實(shí)現(xiàn)了數(shù)理能力和復(fù)雜任務(wù)解決能力的顯著提升。這款模型在處理涉及數(shù)學(xué)推理和復(fù)雜邏輯的問(wèn)題時(shí),展現(xiàn)出了更加出色的表現(xiàn)。
GLM-Z1-Rumination-32B-0414則是一款具備沉思能力的深度推理模型,它的設(shè)計(jì)目標(biāo)是對(duì)標(biāo)OpenAI的Deep Research模型。通過(guò)更長(zhǎng)時(shí)間的深度思考和推理過(guò)程,GLM-Z1-Rumination-32B-0414能夠解決更加開(kāi)放性和復(fù)雜的問(wèn)題。同時(shí),它還能夠結(jié)合搜索工具來(lái)處理各種復(fù)雜任務(wù),進(jìn)一步提升了模型的實(shí)用性和應(yīng)用范圍。
GLM-Z1-9B-0414則是一款開(kāi)源的小尺寸模型,雖然參數(shù)規(guī)模相對(duì)較小,但在數(shù)學(xué)推理和通用任務(wù)中卻展現(xiàn)出了非凡的能力。在同尺寸的開(kāi)源模型中,GLM-Z1-9B-0414的表現(xiàn)處于領(lǐng)先地位,為研究和企業(yè)提供了高性能且成本效益顯著的AI解決方案。
在各項(xiàng)測(cè)試中,GLM-4-32B-0414系列模型也展現(xiàn)出了不俗的實(shí)力。在IFeval指令遵循測(cè)試中,GLM-4-32B-0414得分高達(dá)87.6;在TAU-Bench任務(wù)自動(dòng)化測(cè)試中,該模型在零售場(chǎng)景和航空?qǐng)鼍爸蟹謩e獲得了68.7和51.2的分?jǐn)?shù);在SimpleQA搜索增強(qiáng)問(wèn)答測(cè)試中,GLM-4-32B-0414的得分更是達(dá)到了88.1;而在SWE-bench代碼修復(fù)測(cè)試中,該模型的成功率也高達(dá)33.8%。這些優(yōu)異的成績(jī)充分證明了GLM-4-32B-0414系列模型在多個(gè)應(yīng)用場(chǎng)景中的卓越表現(xiàn)。
GLM-4系列模型還采用了MIT許可協(xié)議,這大大降低了模型的計(jì)算成本和使用門(mén)檻。無(wú)論是研究機(jī)構(gòu)還是企業(yè)用戶(hù),都可以更加便捷地利用這些高性能的AI模型來(lái)推動(dòng)各自領(lǐng)域的發(fā)展和創(chuàng)新。