當地時間週四,Anthropic推出了Claude Opus 4和Claude Sonnet 4,這是其最新一代混合推理AI模型,針對編碼任務和解決複雜問題進行了優化。
據介紹,這兩款模型正在定義人工智能代理的“新標準”,並且“能夠分析數千個數據源,執行長時間運行的任務,編寫與人類水平相當的內容,並執行復雜的操作”。
Anthropic稱,這兩個模型都可以搜索網頁,代表用户完成任務,並在推理和工具使用之間切換。一旦獲得本地文件的訪問權限,他們就可以提取並保存“關鍵信息,以保持連續性並隨着時間的推移構建隱性知識”。
Anthropic表示,在客户測試中,Opus 4可以自主運行7個小時,顯著拓展了AI代理的可能性。
Anthropic還將Claude 4描述為“全球最佳編碼模型”,基準測試顯示,Opus 4在編碼任務和使用網絡搜索等“工具”方面的表現優於谷歌的Gemini 2.5 Pro、OpenAI的o3推理和GPT-4.1模型。
定價上,Claude Opus 4和Sonnet 4是混合模型,提供兩種模式:近乎即時的響應和用於更深層次推理的擴展思維。
Claude的Pro、Max、Team 和 Enterprise訂閲套餐包含這兩種模型和擴展思維,Sonnet 4也面向免費用户開放。
這兩種模型均可在Anthropic API、Amazon Bedrock和Google Cloud的Vertex AI上使用。
定價與之前的Opus和Sonnet模型保持一致:Opus 4的每百萬個Token輸入和輸出價格分別為15美元、75 美元,Sonnet 4的每百萬個Token輸入和輸出價格分別為3美元、15 美元。
Anthropic由前OpenAI研究高管創立,於2023年3月推出了其聊天機器人Claude。
自那時起,它就一直參與到初創公司和科技巨頭之間日益激烈的人工智能軍備競賽中,預計該市場的收入將在十年內突破1萬億美元。
當下,幾乎所有行業的公司都在爭相加入人工智能聊天機器人和代理,以免被競爭對手甩在後面。
據Anthropic首席科學官Jared Kaplan稱,Anthropic於去年年底停止了對聊天機器人的投資,轉而專注於提升 Claude執行復雜任務(例如研究和編碼)的能力。
Jared Kaplan承認:“任務越複雜,模型出錯的風險就越大……我們非常重視解決這個問題,以便人們能夠一次性將大量工作委託給我們的模型。”
Kaplan在一次採訪中表示:“我們從去年就開始訓練這些模型,並且對它們的表現充滿期待。我認為這些模型作為智能體和程序員,其能力要強大得多。這在內部確實很艱難,因為我們用來訓練這些模型的一些新基礎設施……使得團隊在啟動和運行所有功能方面非常緊張。”
隨着模型的不斷迭代,Anthropic的盈利能力也出現快速增長。
上週,Anthropic確認,其第一季度年化營收達到20億美元,較上一季度的10億美元增長了一倍多。
該公司營收主管Kate Jensen最近接受採訪時表示,Anthropic 年度消費超過10萬美元的客户數量同比增長了八倍。