AnthropicがOpenAIを追い抜く：Claude Opus 4が7時間ノンストップでコードを書き、SWE-Benchの最高スコアを樹立し、エンタープライズAIを再構築 from venturebeat.com

海外記事要約

2025.05.23

Anthropic overtakes OpenAI: Claude Opus 4 codes seven hours nonstop, sets record SWE-Bench score and reshapes enterprise AI - venturebeat.com

Claude 4モデルは、ソフトウェアエンジニアリングベンチマークで72.5%のスコアを達成し、2018年4月にOpenAIのGPT-4.1モデルの54%を上回りました。
この技術は、単純なクエリに対する「即時応答」から、最小限の人間による監視とユーザーインタラクションで複雑な問題に対する拡張思考へと進化しました。
さらに、Anthropicは、新しいモデルが登場しても、人間の監視なしに1日を通してコンテキストと集中力を維持できると主張しています。
Open AIよりも明らかに強力なClaudeは、人間の介入を最小限に抑えて複雑な問題を解決できます。