
OpenAI Agents SDK 2026年4月アップデートまとめ — Sandbox Agents / Harness-Compute分離 / 100+モデル対応
2026年4月15日、OpenAI は Agents SDK に対して、エージェントアーキテクチャの世代交代を予感させる大型アップデートを公開しました。中核は以下の3つです。
- Sandbox Agents:永続的な隔離ワークスペースを持つエージェント
- Harness-Compute Separation:制御プレーンと実行プレーンの分離
- Broad LLM Compatibility:Chat Completions API 経由で100+モデルに対応
「単発のチャット応答」から「長時間タスクを完遂するワーカー」へ、エージェントの設計が一段進化した格好です。
1. Sandbox Agents — 永続的な隔離ワークスペース
今回のヘッドライン機能。各エージェントが 独立した隔離ファイルシステムと Git リポジトリ を持ち、状態をスナップショットとして保存できます。
できるようになったこと
- ファイルシステムの永続化(再起動・再接続でも状態を維持)
- Git リポジトリの直接操作(ブランチ切り替え/コミット/差分確認)
- 任意のスナップショットからの再開
- エージェント自身がテストを実行して、変更内容を 自己検証
- 長時間タスク中にコンテキストが失われない
なぜ重要か
従来のエージェントは「一回のセッションで完結する短いタスク」前提でした。Sandbox Agents は "開発者の作業環境そのものを丸ごとエージェントに渡す" モデルで、リファクタリングや段階的な機能実装など、人間が数時間〜数日かけるタスクの自動化が現実的になります。
イメージ的なコード
from openai_agents import Agent, Sandbox
sandbox = Sandbox.create(
git_repo="https://github.com/example/my-app",
branch="feature/refactor-auth",
)
agent = Agent(
model="gpt-5.5",
sandbox=sandbox,
instructions="""
リポジトリ内の認証ロジックをモジュール化し、テストを通してください。
変更ごとにテストを実行し、失敗したら修正してください。
""",
)
result = agent.run()
print(result.summary)
print(result.git_commits)長時間タスクを「任意のタイミングでスナップショット → 後でフォーク」できるため、人間と並行しながら検証していくスタイルが可能になります。
2. Harness-Compute Separation — 制御と実行の分離
エージェントの 制御プレーン(Harness) と 実行プレーン(Compute) を切り分けるアーキテクチャ刷新です。
何が変わったか
| レイヤー | 役割 | 例 |
|---|---|---|
| Harness(制御プレーン) | エージェントの計画/ツール呼び出し決定/状態管理 | OpenAI 側 / 自社サーバー |
| Compute(実行プレーン) | 実際のコード実行/コマンド実行/IO | サンドボックス/コンテナ |
これまでは両者が密結合していて、「実行環境の差し替え」がやりにくいケースがありました。今回の分離によって:
- 同じ Harness で異なる Compute を使い分け できる
- ローカル CLI / クラウドコンテナ / Kubernetes など、実行先を柔軟に選択
- セキュリティ境界を明示的に切れる(権限分離が容易)
エンタープライズ用途では、この アーキテクチャ的な"作法"の整理 が地味に大きな意味を持ちます。
3. Broad LLM Compatibility — 100+モデル対応
Agents SDK は Chat Completions API 互換であれば、どのモデルでも動かせる 構成になりました。
これにより:
- OpenAI モデル(GPT-5系) はもちろん
- Anthropic Claude / Google Gemini / オープンソース系(Llama / Mistral / Gemma) も
- 同じコードベースで切り替え可能
「OpenAI にロックインしたくない」という現実的な要請に正面から応える設計です。エージェントを マルチプロバイダー で組むのが、いよいよ標準になっていきます。
agent = Agent(
model="claude-opus-4-7", # Anthropic
sandbox=sandbox,
instructions="...",
)
agent_alt = Agent(
model="gemini-3.1-pro", # Google
sandbox=sandbox,
instructions="...",
)既存ライブラリとの位置づけ
エージェント周辺は、現状大きく以下のような勢力図になっています。
| プロダクト | 強み | 補足 |
|---|---|---|
| OpenAI Agents SDK | Sandbox / Harness 分離、ツール定義のシンプルさ | OpenAI モデル前提から脱却 |
| Microsoft Agent Framework 1.0 | エンタープライズ統合、A2A / MCP 対応 | Semantic Kernel + AutoGen 統合 |
| LangChain / LangGraph | エコシステムの広さ、グラフワークフロー | TypeScript / Python 対応 |
| Claude Code / Cursor | IDE 統合、サブエージェント、リッチUI | 開発者体験重視 |
Agents SDK は 「コアの薄さ+広いモデル互換」 で、既存のエージェント基盤に組み込みやすい立ち位置になりました。
採用すべきか — 判断ポイント
| ケース | 適合度 |
|---|---|
| 長時間の自律的なコーディングタスクを自動化したい | ◎ |
| リポジトリ操作・テスト実行までエージェントに任せたい | ◎ |
| プロバイダーを将来差し替えたい | ◯ |
| 軽量なFAQボット | △(オーバースペック) |
| クライアントサイドのみのチャットUI | △ |
軽いユースケースに対しては素のChat Completions APIで足りますが、「人間の数時間相当のタスクを並走させたい」 なら、Agents SDK の Sandbox Agents は大きな武器になります。
まとめ
- 2026年4月15日、OpenAI Agents SDK が大型アップデート
- Sandbox Agents で永続ワークスペース+スナップショット運用
- Harness-Compute Separation で制御と実行を分離、実行先を柔軟に
- Chat Completions API 互換 で 100+ モデルに対応、ロックイン回避
- "長時間タスクを任せる" 時代のエージェント設計が一段進化
「コードを書いてくれるAI」から「自分で検証しながら直してくれるAI」へ、開発者体験のフロンティアが移った節目のリリースです。