近日,AI領(lǐng)域迎來了一項(xiàng)重大突破,Anthropic公司發(fā)布了其首個(gè)混合推理模型Claude 3.7 Sonnet,這一創(chuàng)新成果在擴(kuò)展思考模式方面表現(xiàn)卓越,被譽(yù)為迄今為止最強(qiáng)大的模型。據(jù)新智元報(bào)道,Claude 3.7 Sonnet在最新的編碼測(cè)試中展現(xiàn)出了非凡的實(shí)力,超越了o3-mini和DeepSeek R1等競(jìng)爭(zhēng)對(duì)手,成為AI編碼領(lǐng)域的新標(biāo)桿。
Claude 3.7 Sonnet作為Anthropic推出的首款混合推理模型,不僅代表了Claude系列的最高智能水平,更以其近乎即時(shí)的響應(yīng)速度和可擴(kuò)展的、逐步的思考模式贏得了業(yè)界的廣泛關(guān)注。這一模型能夠迅速響應(yīng)并展示詳細(xì)的思考步驟,這些步驟對(duì)用戶而言是完全透明的。
Claude 3.7 Sonnet在編碼和前端網(wǎng)頁(yè)開發(fā)方面取得了顯著提升。用戶不僅可以獲得幾乎即時(shí)的響應(yīng),還可以通過API精細(xì)控制模型的思考時(shí)間。Anthropic還推出了一款名為Claude Code的命令行工具,這款工具旨在幫助開發(fā)人員更智能地進(jìn)行編碼工作。
目前,Claude Code僅作為有限的研究預(yù)覽版提供給開發(fā)人員使用,它允許開發(fā)人員直接從終端將大量的工程任務(wù)委托給Claude處理。這一創(chuàng)新工具不僅提高了開發(fā)效率,還為AI在軟件工程領(lǐng)域的應(yīng)用開辟了新的道路。
在多項(xiàng)基準(zhǔn)測(cè)試中,Claude 3.7 Sonnet憑借其“擴(kuò)展思考”模式在數(shù)學(xué)、物理、指令執(zhí)行和編程等方面刷新了SOTA記錄。與上一代Claude 3.5 Sonnet相比,Claude 3.7 Sonnet在數(shù)學(xué)和編碼能力方面提升了10%以上。除了數(shù)學(xué)領(lǐng)域,Claude 3.7 Sonnet(64k擴(kuò)展思考)幾乎完全超越了o3-mini和DeepSeek R1,與Grok 3不相上下。在SWE-bench上,Claude 3.7 Sonnet更是創(chuàng)下了70.3%的高分,充分證明了其作為最強(qiáng)“軟件工程AI”的實(shí)力。
現(xiàn)在,廣大用戶可以在Claude.ai平臺(tái)上免費(fèi)體驗(yàn)Claude 3.7 Sonnet。無論是Web、iOS還是Android用戶,都可以輕松訪問這一強(qiáng)大的AI模型,享受其帶來的高效和便捷。