亚洲精品国产a久久久久久,亚洲 激情 ,欧美精品,亚洲av日韩综合一区在线观看,亚洲精品不卡av在线播放,无码国产69精品久久久久同性

資訊在沃

DeepSeek-V3.1重磅發(fā)布:混合推理架構引領AI新潮流,適配國產(chǎn)芯片

   發(fā)布時間:2025-08-22 04:46 作者:孫雅

DeepSeek公司近日震撼發(fā)布其最新一代大語言模型——DeepSeek-V3.1,此舉標志著全球AI市場競爭的進一步白熱化。此次更新通過引入創(chuàng)新的混合推理架構和顯著增強的智能體能力,為AI領域帶來了革命性的變化。

DeepSeek-V3.1的核心亮點在于其革命性的混合推理架構,這一架構使模型能夠在同一框架下靈活切換“思考”與“非思考”兩種模式。據(jù)官方公告,新版本經(jīng)過深度訓練和優(yōu)化,在工具使用、編程、搜索等智能體任務上的表現(xiàn)實現(xiàn)了質(zhì)的飛躍。尤為V3.1采用了針對下一代國產(chǎn)芯片設計的UE8M0 FP8 Scale參數(shù)精度。

社區(qū)測試數(shù)據(jù)揭示了新模型的卓越性能。在Aider多語言編程基準測試中,DeepSeek-V3.1的得分超越了Anthropic的Claude 4 Opus,并且在成本控制上展現(xiàn)出顯著優(yōu)勢。這一成績迅速在開發(fā)者社區(qū)中引發(fā)了熱烈反響,模型在Hugging Face平臺上的關注度飆升。

為了提升用戶體驗,DeepSeek同步升級了API接口,不僅將上下文窗口擴展至128K,還新增了對Anthropic API格式的支持,極大簡化了遷移過程。更為關鍵的是,公司宣布將于2025年9月6日起實施新的API定價方案,并取消夜間優(yōu)惠,這一舉措被視為其在服務能力大幅提升后加速商業(yè)化進程的重要一步。

混合推理架構的引入,標志著DeepSeek正邁向智能體時代的新篇章。據(jù)DeepSeek官網(wǎng)介紹,此次升級帶來了多項重大變化:混合推理架構讓模型同時支持思考模式與非思考模式,思考效率顯著提升,相比前代模型,DeepSeek-V3.1-Think能在更短時間內(nèi)給出答案。通過Post-Training優(yōu)化,新模型在工具使用和智能體任務中的表現(xiàn)得到了大幅提升。

在效率方面,新的思考模式經(jīng)過思維鏈壓縮訓練,相比上一代模型,在任務表現(xiàn)相當?shù)那闆r下,token消耗量減少了20%至50%。這一改進不僅提升了模型的性能,還降低了運行成本,增強了其在商業(yè)場景中的競爭力。

新模型在編程和搜索等智能體能力方面實現(xiàn)了顯著增強。DeepSeek公布的數(shù)據(jù)顯示,V3.1在代碼修復和命令行終端任務測試中,性能相較于公司以往模型有了明顯提高。在復雜搜索測試中,模型同樣表現(xiàn)出色,大幅領先于競爭對手。社區(qū)進行的第三方測試進一步證實了V3.1在編程能力上的躍升,其在Aider編程基準上取得了71.6%的高分,超越了多個知名模型,且成本效益顯著。

在開源與API更新方面,DeepSeek繼續(xù)其開放策略,將V3.1的Base模型和后訓練模型發(fā)布在Hugging Face與魔搭社區(qū)上。此次發(fā)布的模型參數(shù)量為685B,Base模型在V3基礎上進行了額外的840B token訓練。公司提醒開發(fā)者注意,新模型采用了新的參數(shù)精度,且分詞器和聊天模板有所調(diào)整,部署時需參考最新文檔。

API服務也迎來了全面升級。除了擴展上下文長度外,DeepSeek還為開發(fā)者提供了更強大的工具調(diào)用功能,如支持strict模式的Function Calling,以確保輸出格式的規(guī)范性。為降低生態(tài)遷移成本,API增加了對Anthropic API格式的兼容支持,方便使用Claude Code框架的開發(fā)者接入DeepSeek模型。

在技術與產(chǎn)品更新的同時,DeepSeek也邁出了堅定的商業(yè)化步伐。公司宣布將于2025年9月6日起調(diào)整API接口調(diào)用價格,并取消夜間時段優(yōu)惠。這一調(diào)整旨在更好地滿足用戶調(diào)用需求,并伴隨著API服務資源的擴容。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容
本欄最新