性做久久久久久,亚洲狠狠婷婷综合久久

阿里云QwQ-32B大模型：萌名之下，能否與DeepSeek-R1一較高下？

發(fā)布時(shí)間：2025-03-06 20:59 來(lái)源：ITBEAR 作者：馮璃月

近日，阿里云旗下的通義千問(wèn)團(tuán)隊(duì)正式揭曉了其最新的技術(shù)成果——QwQ-32B推理模型。這款模型配備了驚人的320億參數(shù)，卻在性能上展現(xiàn)出了與擁有6710億參數(shù)（活躍參數(shù)370億）的DeepSeek-R1模型相媲美的實(shí)力。

QwQ-32B模型現(xiàn)已在Hugging Face和ModelScope兩大平臺(tái)上開(kāi)源，并遵循Apache 2.0開(kāi)源協(xié)議，這標(biāo)志著阿里云在推動(dòng)AI技術(shù)開(kāi)放共享方面邁出了重要一步。

用戶可以通過(guò)Qwen Chat或通義平臺(tái)，親身體驗(yàn)QwQ-32B的強(qiáng)大功能。在Qwen Chat中，用戶只需選擇Qwen2.5-Plus并開(kāi)啟QwQ深度思考模式，即可感受其卓越的推理能力。同樣，在通義App或網(wǎng)頁(yè)端，用戶也能輕松選擇Qwen-QwQ-32B智能體進(jìn)行互動(dòng)。

盡管QwQ的名字聽(tīng)起來(lái)有些俏皮可愛(ài)，但其性能卻不容小覷。阿里云對(duì)QwQ-32B進(jìn)行了全面的性能測(cè)試，包括數(shù)學(xué)推理、編程能力和通用能力等多個(gè)方面。測(cè)試結(jié)果顯示，QwQ-32B在數(shù)學(xué)能力評(píng)測(cè)集AIME24和代碼能力評(píng)估平臺(tái)LiveCodeBench上的表現(xiàn)，與DeepSeek-R1相當(dāng)，甚至在某些方面超越了后者。同時(shí)，在與o1-mini及相同尺寸的R1蒸餾模型的對(duì)比中，QwQ-32B也展現(xiàn)出了明顯的優(yōu)勢(shì)。

在由meta首席科學(xué)家楊立昆領(lǐng)銜的“最難LLMs評(píng)測(cè)榜”LiveBench、谷歌提出的指令遵循能力IFeval評(píng)測(cè)集以及加州大學(xué)伯克利分校等提出的BFCL測(cè)試中，QwQ-32B的得分均超過(guò)了DeepSeek-R1，進(jìn)一步證明了其強(qiáng)大的推理能力。

阿里云表示，QwQ-32B的推出是其在大規(guī)模強(qiáng)化學(xué)習(xí)（RL）以增強(qiáng)推理能力方面的初步嘗試。通過(guò)這一嘗試，阿里云不僅看到了擴(kuò)展RL的巨大潛力，還發(fā)現(xiàn)了預(yù)訓(xùn)練語(yǔ)言模型中尚未充分發(fā)掘的可能性。未來(lái)，阿里云將繼續(xù)致力于開(kāi)發(fā)下一代Qwen模型，計(jì)劃將更強(qiáng)大的基礎(chǔ)模型與依托規(guī)?；?jì)算資源的RL相結(jié)合，以推動(dòng)人工智能向人工通用智能（AGI）的邁進(jìn)。

阿里云還在積極探索將智能體與RL集成的可能性，以實(shí)現(xiàn)長(zhǎng)時(shí)推理。這一目標(biāo)的實(shí)現(xiàn)，將有助于通過(guò)推理時(shí)間的擴(kuò)展來(lái)釋放更高的智能水平，為人工智能的發(fā)展注入新的活力。

除了QwQ-32B外，阿里云通義千問(wèn)團(tuán)隊(duì)還擁有其他強(qiáng)大的模型，如QvQ等，它們共同構(gòu)成了阿里云在AI領(lǐng)域的強(qiáng)大陣容。

更多>同類內(nèi)容

亚洲精品国产a久久久久久,亚洲 激情 ,欧美精品,亚洲av日韩综合一区在线观看,亚洲精品不卡av在线播放,无码国产69精品久久久久同性

阿里云QwQ-32B大模型：萌名之下，能否與DeepSeek-R1一較高下？

亚洲精品国产a久久久久久,亚洲激情 ,欧美精品,亚洲av日韩综合一区在线观看,亚洲精品不卡av在线播放,无码国产69精品久久久久同性

阿里云QwQ-32B大模型：萌名之下，能否與DeepSeek-R1一較高下？