亚洲精品国产a久久久久久,亚洲 激情 ,欧美精品,亚洲av日韩综合一区在线观看,亚洲精品不卡av在线播放,无码国产69精品久久久久同性

資訊在沃

阿里云QwQ-32B大模型:萌名之下,能否與DeepSeek-R1一較高下?

   發(fā)布時(shí)間:2025-03-06 20:59 作者:馮璃月

近日,阿里云旗下的通義千問(wèn)團(tuán)隊(duì)正式揭曉了其最新的技術(shù)成果——QwQ-32B推理模型。這款模型配備了驚人的320億參數(shù),卻在性能上展現(xiàn)出了與擁有6710億參數(shù)(活躍參數(shù)370億)的DeepSeek-R1模型相媲美的實(shí)力。

QwQ-32B模型現(xiàn)已在Hugging Face和ModelScope兩大平臺(tái)上開(kāi)源,并遵循Apache 2.0開(kāi)源協(xié)議,這標(biāo)志著阿里云在推動(dòng)AI技術(shù)開(kāi)放共享方面邁出了重要一步。

用戶可以通過(guò)Qwen Chat或通義平臺(tái),親身體驗(yàn)QwQ-32B的強(qiáng)大功能。在Qwen Chat中,用戶只需選擇Qwen2.5-Plus并開(kāi)啟QwQ深度思考模式,即可感受其卓越的推理能力。同樣,在通義App或網(wǎng)頁(yè)端,用戶也能輕松選擇Qwen-QwQ-32B智能體進(jìn)行互動(dòng)。

盡管QwQ的名字聽(tīng)起來(lái)有些俏皮可愛(ài),但其性能卻不容小覷。阿里云對(duì)QwQ-32B進(jìn)行了全面的性能測(cè)試,包括數(shù)學(xué)推理、編程能力和通用能力等多個(gè)方面。測(cè)試結(jié)果顯示,QwQ-32B在數(shù)學(xué)能力評(píng)測(cè)集AIME24和代碼能力評(píng)估平臺(tái)LiveCodeBench上的表現(xiàn),與DeepSeek-R1相當(dāng),甚至在某些方面超越了后者。同時(shí),在與o1-mini及相同尺寸的R1蒸餾模型的對(duì)比中,QwQ-32B也展現(xiàn)出了明顯的優(yōu)勢(shì)。

在由meta首席科學(xué)家楊立昆領(lǐng)銜的“最難LLMs評(píng)測(cè)榜”LiveBench、谷歌提出的指令遵循能力IFeval評(píng)測(cè)集以及加州大學(xué)伯克利分校等提出的BFCL測(cè)試中,QwQ-32B的得分均超過(guò)了DeepSeek-R1,進(jìn)一步證明了其強(qiáng)大的推理能力。

阿里云表示,QwQ-32B的推出是其在大規(guī)模強(qiáng)化學(xué)習(xí)(RL)以增強(qiáng)推理能力方面的初步嘗試。通過(guò)這一嘗試,阿里云不僅看到了擴(kuò)展RL的巨大潛力,還發(fā)現(xiàn)了預(yù)訓(xùn)練語(yǔ)言模型中尚未充分發(fā)掘的可能性。未來(lái),阿里云將繼續(xù)致力于開(kāi)發(fā)下一代Qwen模型,計(jì)劃將更強(qiáng)大的基礎(chǔ)模型與依托規(guī)?;?jì)算資源的RL相結(jié)合,以推動(dòng)人工智能向人工通用智能(AGI)的邁進(jìn)。

阿里云還在積極探索將智能體與RL集成的可能性,以實(shí)現(xiàn)長(zhǎng)時(shí)推理。這一目標(biāo)的實(shí)現(xiàn),將有助于通過(guò)推理時(shí)間的擴(kuò)展來(lái)釋放更高的智能水平,為人工智能的發(fā)展注入新的活力。

除了QwQ-32B外,阿里云通義千問(wèn)團(tuán)隊(duì)還擁有其他強(qiáng)大的模型,如QvQ等,它們共同構(gòu)成了阿里云在AI領(lǐng)域的強(qiáng)大陣容。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容
本欄最新