Claude Prompt Caching と Pre-warming 徹底解説 - 5分/1時間キャッシュと max_tokens=0 ウォームアップで TTFT を短縮する2026年5月15日Anthropic Claude API のプロンプトキャッシング(Automatic / Explicit / 1時間TTL / Pre-warming)を、料金構造・キャッシュ無効化・cache_control の置き場所・max_tokens=0 によるウォームアップ運用まで実装目線で整理します。ClaudeAnthropicLLMAPIプロンプトキャッシングパフォーマンス