
Gemini 3.5 Flash - 高速・低価格でコーディングとエージェントを強化(Pro はプレビュー)
Google の高速モデル系列に Gemini 3.5 Flash が加わりました(2026年5月19日 I/O で一般提供開始)。速くて安く、コーディングとエージェントで前世代を伸ばしたのが要点です。一方で話題の Gemini 3.5 Pro はまだ GA していません。この記事では、Google 公式情報を一次ソースに、Flash の実力と Pro の現状を正確に整理します。
Gemini 3.5 Flash とは
- 2026年5月19日に GA(Gemini アプリ / Gemini API / AI Studio / Vertex AI / Android Studio など)
- モデルID は
gemini-3.5-flash(サフィックス無し=安定版) - 1Mトークン(1,048,576)の入力コンテキスト、最大出力 65,536 トークン
- 入力はテキスト・画像・動画・音声・PDFに対応(出力はテキスト)
- thinking(推論)は4段階(minimal / low / medium / high、既定 medium)
- 知識カットオフは 2025年1月
スペックと価格
| 項目 | 値 |
|---|---|
| GA日 | 2026年5月19日 |
| 入力コンテキスト | 約1Mトークン |
| 最大出力 | 65,536トークン |
| thinking | 4段階(既定 medium) |
| 入力価格 | $1.50 / 1Mトークン |
| 出力価格 | $9.00 / 1Mトークン |
WARNING
価格は 3.1 Flash の3倍です。 Gemini 3.1 Flash は入力 $0.50 / 出力 $3.00 でした。性能は上がっていますが、コスト最重視なら 3.1 Flash 系(や Flash-Lite)も依然選択肢です。用途に対して「速度・品質・価格」のどれを取るかで選びましょう。
何が伸びたのか(コーディング・エージェント)
公式は「出力トークン/秒が他のフロンティアモデル比で4倍速」(比較表現で、絶対値は非公開)とし、難しいコーディング/エージェント系ベンチで前世代を上回るとしています。
| ベンチ | 3.5 Flash | 3 Flash(前世代) |
|---|---|---|
| Terminal-Bench 2.1 | 76.2% | 58.0% |
| MCP Atlas(エージェント) | 83.6% | 62.0% |
| SWE-Bench Pro | 55.1% | 49.6% |
NOTE
モデルカードの比較は主に Gemini 3 Flash(前世代)に対するものです。「3.1 Pro を上回る」という主張は MCP Atlas や Finance Agent などコーディング/エージェント系の一部ベンチに限った話で、あらゆる性能で上回るという意味ではありません。前世代の Flash 系はGemini 3.1 Flash(Live / TTS)も参照。
ツール利用(function calling・code execution・file search・structured outputs・search grounding・URL context など)に対応し、エージェント用途を意識した構成です。
Gemini 3.5 Pro の現状(GA ではない)
ここは取り違えやすいので明確に。
WARNING
Gemini 3.5 Pro はまだ一般提供(GA)されていません(2026年6月24日時点)。 I/O で「翌月(6月)にロールアウト予定」と予告され、現在は Vertex AI のエンタープライズ向け限定プレビューのみ。一般 API・AI Studio の通常モデルピッカー・消費者向けアプリには未提供です。
予告されている特長は 2Mトークンのコンテキストと Deep Think 推論。具体的な GA 日・モデルID・価格は公式未発表です(流れている価格は二次情報の推定)。「Pro が出た」という記述は現時点では誤りなので注意してください。
使い方
API ではモデルID gemini-3.5-flash を指定するだけです。AI Studio(Antigravity)や Vertex AI からも利用できます。バッチ(50%割引)・キャッシング・thinking レベル指定にも対応します。
オープンウェイト系と比べたい場合は、コーディング特化のGLM-5.2や、軽量・拡散方式のDiffusionGemmaも合わせてどうぞ。
まとめ
- Gemini 3.5 Flash は2026年5月19日に GA。
gemini-3.5-flash、1Mコンテキスト、4段階 thinking、知識カットオフ2025年1月 - コーディング/エージェント系ベンチで前世代を大きく改善(Terminal-Bench・MCP Atlas など)。「4倍速」は対フロンティアの比較表現
- 価格は 入力$1.50 / 出力$9.00。ただし 3.1 Flash の3倍なので、コスト重視は下位 Flash も検討
- Gemini 3.5 Pro は未 GA(限定プレビュー)。2Mコンテキスト・Deep Think は予告段階で、GA日・価格は未発表
速くて賢い Flash が一段強くなり、エージェント用途の選択肢が増えました。ただし値上げと Pro 未提供は要注意。まずは Flash を実タスクで試し、Pro は GA を待つ、が現実的な構えです。


