CLAUDE原文:EN
Claude Opus 4.8発表 — GPT-5.5超えのベンチマーク性能と努力レベル制御を搭載
Introducing Claude Opus 4.8
via Anthropic· 収集日:2026年5月30日
日本語要約
Anthropicは2026年5月28日にClaude Opus 4.8を正式発表した。コーディング・エージェントタスク・推論・知識作業の全分野でOpus 4.7を上回る性能向上を実現し、エージェントコーディングベンチマークで69.2%(Opus 4.7は64.3%、GPT-5.5は58.6%)を記録。多分野推論ベンチマーク(Humanity's Last Exam)ではツールあり57.9%を達成し現時点で最高スコアとなった。新機能「努力レベル制御」では低・中・高・最大高・最大の5段階を選択でき、高設定ではより深く思考してより良い回答を生成し、低設定では高速回答とレート制限の節約が可能。信頼性改善として自分の生成コードの欠陥を見逃す確率がOpus 4.7の4分の1になったことも明示された。努力レベル制御はclaude.ai・Cowork・Claude Codeで利用可能で、Opus 4.8はデフォルトで「高」に設定されている。
編集コメント
Opus 4.8は「控えめだが実質的な改善」と位置付けられているが、エージェントコーディングでのGPT-5.5超えは実用上の競争力を明確に示している。努力レベル制御は開発者がコストとパフォーマンスのバランスを細かくコントロールできる実践的な新機能だ。コード信頼性の4倍向上は数値として検証しやすい指標であり、プロダクション環境でのAI活用を検討する開発チームに具体的な評価材料を提供している。
参考:Anthropicの記事をもとに要約