CLAUDE CODE原文:EN

キャッシュ診断機能がベータ公開:プロンプトキャッシュミスの原因を特定可能に

Cache Diagnostics in Public Beta: Understand Why Your Prompt Cache Missed

via Anthropic Claude Platform Docs· 収集日:2026年5月25日

日本語要約

Anthropicは2026年5月13日、プロンプトキャッシュの最適化を支援する「キャッシュ診断」機能をパブリックベータとして公開した。Messagesリクエストにdiagnostics.previous_message_idを渡すと、APIはキャッシュプレフィックスが前のターンからどこで乖離したかを説明するcache_miss_reasonを返す。これにより、プロンプトキャッシュが想定通りに機能していない原因を特定し、コストと遅延を最適化できる。利用にはリクエストヘッダーにcache-diagnosis-2026-04-07ベータヘッダーを含める必要がある。プロンプトキャッシュは正しく設定すればトークンコストを最大90%削減・レイテンシを最大80%削減できるが、その設定の正確性を検証するのが難しいという課題があった。今回の機能はその問題を直接解決する。

編集コメント

プロンプトキャッシュは高頻度APIコール環境でのコスト削減に直結するが、「キャッシュが効いているかどうか」の確認が困難だった。キャッシュ診断機能はその問題を直接解決し、特に長いシステムプロンプトを使うアプリケーションやマルチターン会話システムの最適化に役立つ。APIコストが気になる開発者はベータ期間中に積極的に活用してキャッシュ効率を計測すべき重要な機能。

参考:Anthropic Claude Platform Docsの記事をもとに要約