CLAUDE原文:EN
Claude Opus 4.8正式公開―コーディング精度と誠実さで前世代を凌駕
Anthropic Launches Claude Opus 4.8 With Gains in Coding and Honesty
via MacRumors· 収集日:2026年6月1日
日本語要約
MacRumorsはAnthropicのClaude Opus 4.8リリースを詳報した。SWE-bench Pro(実務的なコード修正ベンチマーク)で69.2%を達成し、前世代Opus 4.7の64.3%を5ポイント上回った。エラーをフラグせずに通過させてしまう割合はOpus 4.7の19.7%からOpus 4.8の3.7%へと大幅に低下し、コードレビュー補助としての実用性が向上している。アノテーターによる評価でもOpus 4.7比でコーディングが5%、推論が3%改善と評価された。Claude API・Amazon Bedrock・Vertex AIで利用可能で、1Mトークンコンテキストウィンドウをデフォルト提供する。価格はOpus 4.7から変更なし。
編集コメント
同価格帯での性能向上は既存APIユーザーにとって移行コストなしのアップグレードを意味する。SWE-bench Proスコアの5ポイント向上はコード修正の精度向上として実際のプロジェクトで体感しやすい指標だ。1Mトークンコンテキストのデフォルト提供で大規模コードベースへの対応力も増し、実務的な採用メリットは大きい。
参考:MacRumorsの記事をもとに要約