首頁 > 科技要聞 > 科技> 正文

劍指OpenAI,Anthropic推出全球首個(gè)“混合推理模型”,最新估值615億美元

騰訊科技 整合編輯:太平洋科技 發(fā)布于:2025-02-26 16:23

美國當(dāng)?shù)貢r(shí)間周一, 由OpenAI前員工創(chuàng)辦的人工智能公司Anthropic突發(fā)連招。在技術(shù)方面,Anthropic宣布推出全球首個(gè) “混合推理”AI模型,向OpenAI、DeepSeek等對(duì)手發(fā)起挑戰(zhàn)。在運(yùn)營方面,該公司表示即將完成35億美元融資,估值達(dá)到615億美元。

全球首款 “混合推理”AI模型

Anthropic此次發(fā)布的新模型名為Claude 3.7 Sonnet,它賦予了用戶前所未有的控制權(quán),允許他們決定AI在生成回答前花費(fèi)多少時(shí)間進(jìn)行“思考”。與此同時(shí),Anthropic還推出了AI編程助手Claude Code。這些舉措標(biāo)志著Anthropic正大舉進(jìn)軍企業(yè)AI市場,或?qū)氐赘淖兤髽I(yè)構(gòu)建軟件和自動(dòng)化工作的方式。

圖片

Claude 3.7 Sonnet引入了“思考模式”切換功能,允許用戶根據(jù)任務(wù)復(fù)雜度優(yōu)化AI的響應(yīng)時(shí)間。Anthropic研究產(chǎn)品管理負(fù)責(zé)人Dianne Penn表示:“我們認(rèn)為推理是AI的核心組成部分,而不是需要額外付費(fèi)才能使用的功能。就像人類一樣,AI應(yīng)該既能快速響應(yīng),又能進(jìn)行復(fù)雜思考。對(duì)于簡單問題,它應(yīng)該立即給出答案;但對(duì)于復(fù)雜的任務(wù),它則需要更多的處理時(shí)間!

她補(bǔ)充道:“我們不將推理、規(guī)劃和自我修正視為AI的獨(dú)立能力。在理想情況下,模型本身應(yīng)該能夠識(shí)別問題是否需要更深入的思考,并自動(dòng)調(diào)整,而不是要求用戶來選擇不同的推理模式!

基準(zhǔn)測試數(shù)據(jù)支持了Anthropic的雄心。在擴(kuò)展思考模式下,Claude 3.7 Sonnet在研究生級(jí)別的推理任務(wù)中,準(zhǔn)確率達(dá)到78.2%,不僅對(duì)OpenAI的最新模型發(fā)起挑戰(zhàn),還超越了DeepSeek-R1的表現(xiàn)。

以下為Anthropic官文全文:

今天,我們正式推出Claude 3.7 Sonnet,這是我們迄今為止最智能的模型,也是市場上首款“混合推理”模型。Claude 3.7 Sonnet能夠生成近乎即時(shí)的響應(yīng),也能進(jìn)行長時(shí)間的推理,并將這些思考過程展示給用戶。API用戶還可以精細(xì)控制模型的思考時(shí)間。

Claude 3.7 Sonnet在編程和前端Web開發(fā)方面表現(xiàn)尤為突出。伴隨著新模型的發(fā)布,我們還推出了一款命令行工具Claude Code,專門用于輔助編程。Claude Code目前以有限研究預(yù)覽的形式提供,允許開發(fā)者直接從終端將大量工程任務(wù)委托給Claude完成。

Claude 3.7 Sonnet現(xiàn)已登陸所有Claude訂閱計(jì)劃(包括免費(fèi)版、Pro版、Team版和企業(yè)版),并支持Anthropic API、Amazon Bedrock和Google Cloud的Vertex AI平臺(tái)。除了免費(fèi)版Claude之外,其他版本都可以使用擴(kuò)展思考模式。

無論是標(biāo)準(zhǔn)模式還是擴(kuò)展思考模式,Claude 3.7 Sonnet的定價(jià)均與之前版本保持一致:每百萬輸入token收費(fèi)3美元,每百萬輸出token收費(fèi)15美元(其中包含思考token)。

Claude 3.7 Sonnet:讓前沿推理變得實(shí)用

Claude 3.7 Sonnet的開發(fā)理念與市場上其他推理模型截然不同。就像人類的大腦既可以處理快速反應(yīng),也能進(jìn)行深度思考,我們認(rèn)為推理應(yīng)該是前沿模型的集成能力,而非完全獨(dú)立的模型。這種統(tǒng)一的方法也為用戶創(chuàng)造了更無縫的體驗(yàn)。

Claude 3.7 Sonnet通過多種方式體現(xiàn)了這一理念:

——雙重模式:Claude 3.7 Sonnet既是普通的大語言模型(LLM),也是推理模型。用戶可以選擇讓模型在正常模式下給出快速響應(yīng),或進(jìn)行更長時(shí)間的思考后再回答。在標(biāo)準(zhǔn)模式下,Claude 3.7 Sonnet是Claude 3.5 Sonnet的升級(jí)版;在擴(kuò)展思考模式下,它會(huì)在回答問題前進(jìn)行自我反思,從而在數(shù)學(xué)、物理、指令遵循、編程等任務(wù)中表現(xiàn)更佳。我們發(fā)現(xiàn),無論在哪種模式下,提示模型的方式都相似。

——精細(xì)控制:通過API使用Claude 3.7 Sonnet時(shí),用戶可以設(shè)置思考的token預(yù)算,最高可達(dá)128K token。這使得用戶能夠在速度(和成本)與回答質(zhì)量之間做出權(quán)衡。

——現(xiàn)實(shí)任務(wù)優(yōu)化:在開發(fā)推理模型時(shí),我們減少了對(duì)數(shù)學(xué)和計(jì)算機(jī)科學(xué)競賽題的優(yōu)化,轉(zhuǎn)而更關(guān)注反映企業(yè)實(shí)際使用LLM的現(xiàn)實(shí)任務(wù)。

早期測試表明,Claude的編程能力處于行業(yè)領(lǐng)先地位。

Cursor表示,Claude再次成為處理實(shí)際編程任務(wù)的最佳選擇,特別是在處理復(fù)雜代碼庫和高級(jí)工具使用方面取得了顯著進(jìn)展。

Cognition發(fā)現(xiàn),Claude在規(guī)劃代碼變更和處理全棧更新方面遠(yuǎn)超其他任何模型。

Vercel強(qiáng)調(diào)了Claude在復(fù)雜代理工作流中的卓越表現(xiàn),而Replit成功利用Claude從零開始構(gòu)建復(fù)雜的Web應(yīng)用和儀表盤,而其他模型則難以勝任。

Canva的評(píng)估顯示,Claude始終能生成生產(chǎn)級(jí)代碼,設(shè)計(jì)品味出眾,且錯(cuò)誤率大幅降低。

在SWE-bench Verified和TAU-bench等基準(zhǔn)測試中,Claude 3.7 Sonnet均達(dá)到了最先進(jìn)的性能水平,展現(xiàn)了其解決現(xiàn)實(shí)世界軟件問題和復(fù)雜任務(wù)的能力。

圖注:在SWE-bench Verified基準(zhǔn)測試中,Claude 3.7 Sonnet的性能表現(xiàn)最佳。該測試旨在評(píng)估AI模型解決現(xiàn)實(shí)世界軟件問題的能力

圖注:Claude 3.7 Sonnet在TAU-bench基準(zhǔn)測試中表現(xiàn)優(yōu)異。該測試框架專注于評(píng)估AI模型在復(fù)雜現(xiàn)實(shí)任務(wù)中的表現(xiàn),包括與用戶和工具的交互

圖注:Claude 3.7 Sonnet在指令遵循、通用推理、多模態(tài)能力以及智能體編碼方面表現(xiàn)卓越,其擴(kuò)展思考模式在數(shù)學(xué)和科學(xué)任務(wù)中尤為突出,顯著提升了性能。不僅如此,在傳統(tǒng)基準(zhǔn)測試之外,其表現(xiàn)甚至在內(nèi)部Pokémon游戲測試中超越了所有之前的模型

Claude Code:增強(qiáng)開發(fā)者編程體驗(yàn)

自2024年6月以來,Sonnet已成為全球開發(fā)者的首選模型。今天,我們進(jìn)一步賦能開發(fā)者,推出首款智能體級(jí)編碼工具Claude Code,并以有限研究預(yù)覽的形式提供。

Claude Code是一個(gè)活躍的協(xié)作者,能夠搜索和讀取代碼、編輯文件、編寫和運(yùn)行測試、提交代碼到GitHub,并使用命令行工具——同時(shí)讓用戶隨時(shí)掌握每一步進(jìn)展。

盡管Claude Code尚處于早期階段,但它已成為我們團(tuán)隊(duì)不可或缺的工具,尤其是在測試驅(qū)動(dòng)開發(fā)、調(diào)試復(fù)雜問題和大規(guī)模重構(gòu)方面。在早期測試中,Claude Code一次性完成了通常需要45分鐘以上手動(dòng)工作的任務(wù),明顯減少了開發(fā)時(shí)間和工作量。

未來幾周,我們將根據(jù)使用情況不斷改進(jìn)Claude Code,包括增強(qiáng)工具調(diào)用的可靠性、支持長時(shí)間運(yùn)行的命令、優(yōu)化應(yīng)用內(nèi)渲染,并擴(kuò)展Claude對(duì)其自身能力的理解。

我們還改進(jìn)了Claude.ai的編碼體驗(yàn)。GitHub集成現(xiàn)已覆蓋所有Claude訂閱計(jì)劃,使開發(fā)者能夠直接將代碼庫連接到Claude。

Claude 3.7 Sonnet是我們迄今為止最強(qiáng)大的編碼模型。通過對(duì)個(gè)人、工作和開源項(xiàng)目的深入理解,它成為修復(fù)漏洞、開發(fā)新功能和構(gòu)建文檔的強(qiáng)力伙伴。

展望未來

Claude 3.7 Sonnet和Claude Code標(biāo)志著AI系統(tǒng)朝著真正增強(qiáng)人類能力的方向邁出了重要一步。通過深度推理、自主工作和高效協(xié)作能力,它們使我們更接近一個(gè)AI能夠豐富和擴(kuò)展人類成就的未來。

即將完成35億美元融資 估值達(dá)615億美元

在發(fā)布新模型的同時(shí),知情人士透露Anthropic即將完成一輪35億美元融資,估值達(dá)615億美元。這輪融資顯示,盡管DeepSeek的崛起帶來了沖擊,但投資者仍對(duì)潛力巨大的人工智能公司充滿信心。

最初計(jì)劃融資20億美元,但在與投資者洽談后成功提高了融資額度。該公司由前OpenAI員工于2021年創(chuàng)立,之前的估值為180億美元,現(xiàn)已成為少數(shù)幾家擁有足夠人才和資金與OpenAI競爭的AI初創(chuàng)公司。

此次融資使得Anthropic的估值攀升至615億美元,這一估值包含了公司此次融資所籌集的資金。

本輪融資的投資者包括風(fēng)險(xiǎn)投資公司Lightspeed Venture Partners、General Catalyst和Bessemer Venture Partners。此外,總部位于阿布扎比的MGX投資公司也在與Anthropic商談參與投資事宜。

雖然Anthropic在消費(fèi)者用戶市場上仍落后于OpenAI,但其推出的Claude聊天機(jī)器人在程序員和企業(yè)客戶中逐漸獲得青睞。

知情人士透露,Anthropic的年化收入(基于近期銷售數(shù)據(jù)推算的未來12個(gè)月收入)已達(dá)約12億美元。盡管如此,該公司目前仍處于虧損狀態(tài),計(jì)劃利用此次融資支持開發(fā)更強(qiáng)大的AI模型。

相比之下,OpenAI在2024年10月的融資輪中透露,預(yù)計(jì)2024年的收入將達(dá)到37億美元。

自從DeepSeek發(fā)布了一款與美國最強(qiáng)大AI模型相媲美的新型AI模型后,硅谷的一些投資者對(duì)Anthropic等公司的前景表示擔(dān)憂。DeepSeek的模型不僅開發(fā)成本極低,而且可以免費(fèi)使用。

對(duì)此,Anthropic首席執(zhí)行官達(dá)里奧·阿莫代伊(Dario Amodei)在一篇博客中指出,DeepSeek的成功并未改變開發(fā)AI技術(shù)的經(jīng)濟(jì)邏輯。

這輪大規(guī)模融資表明,投資者仍然愿意押注于像Anthropic這樣開發(fā)專有AI模型的公司。

與此同時(shí),OpenAI也在洽談籌集高達(dá)400億美元的資金,估值為3000億美元。此外,埃隆·馬斯克旗下的xAI公司也正在進(jìn)行非正式的融資洽談,計(jì)劃進(jìn)行一輪大規(guī)模融資。

本文來源:騰訊科技

網(wǎng)友評(píng)論

聚超值•精選

推薦 手機(jī) 筆記本 影像 硬件 家居 商用 企業(yè) 出行 未來
  • 漢美馳李梟雄:擁抱AI浪潮,智能家居需求暴增勢不可擋
    漢美馳李梟雄:擁抱AI浪潮,智能家居需求暴增勢不可擋

    作為美國百年家電品牌,HamiltonBeach漢美馳在美國市場處于行業(yè)領(lǐng)導(dǎo)地位,在本屆AWE展會(huì)上,漢美馳與太平洋網(wǎng)絡(luò)合作,展出了他們的三個(gè)主打品類:破壁機(jī)、慢燉鍋和空氣炸鍋,其中,破壁機(jī)屬于攪拌類小家電,漢美馳是這個(gè)品類的開創(chuàng)者;慢燉鍋是美國家庭的必需品,就像我們中國家庭的電飯煲一樣,漢美馳慢燉鍋累計(jì)在美國的銷量超過3000萬臺(tái),是這個(gè)品類的領(lǐng)導(dǎo)品牌;漢美馳的這款HALO空氣炸鍋剛剛獲得了全球頂級(jí)設(shè)計(jì)大獎(jiǎng)——iF設(shè)計(jì)獎(jiǎng)。 今年,漢美馳在國內(nèi)市場的動(dòng)作很多,包括:推出了家電行業(yè)第一款應(yīng)用chatGPT的AI牛排機(jī),全球首發(fā)煙灶產(chǎn)品,全球首發(fā)中式廚電產(chǎn)品,自建抖音、淘寶直播間,與頭部主播烈兒寶貝等合作……這些經(jīng)營動(dòng)作的背后,漢美馳有怎樣的戰(zhàn)略規(guī)劃?他們對(duì)中國市場有些什么樣的判斷?他們的優(yōu)勢有哪些?請(qǐng)看PConline獨(dú)家專訪漢美馳中國營銷中心總經(jīng)理李梟雄先生。

    呼倫 呼倫 2023-05-05 00:03
  • 二維碼 回到頂部
    国产younv在线精品,先锋AV无码资源不卡,亚洲国产高清不卡在线播放,伊人久久东京av