
AutoTTS 解説 - 人間は「環境」を設計し、LLM が「戦略」を発見するテスト時スケーリングの新パラダイム
arXiv:2605.08083v2「LLMs Improving LLMs: Agentic Discovery for Test-Time Scaling」で提案された AutoTTS を解説します。Test-Time Scaling (TTS) 戦略を人手で設計するのではなく、人間は「環境」を作り、LLM エージェントが戦略コード(branch / continue / probe / prune / stop の方針)を自動発見する枠組み。オフラインリプレイ環境、β パラメタリゼーション、実行トレース・フィードバックという 3 つの設計判断を中心に整理します。