AutoTTS の記事一覧 | プランタン

AutoTTS 解説 - 人間は「環境」を設計し、LLM が「戦略」を発見するテスト時スケーリングの新パラダイム

2026年5月26日約19分

arXiv:2605.08083v2「LLMs Improving LLMs: Agentic Discovery for Test-Time Scaling」で提案された AutoTTS を解説します。Test-Time Scaling (TTS) 戦略を人手で設計するのではなく、人間は「環境」を作り、LLM エージェントが戦略コード（branch / continue / probe / prune / stop の方針）を自動発見する枠組み。オフラインリプレイ環境、β パラメタリゼーション、実行トレース・フィードバックという 3 つの設計判断を中心に整理します。

LLM AI 機械学習論文解説 AutoTTS Test-Time Scaling