Gemini 3.5 Flash - 高速・低価格でコーディングとエージェントを強化(Pro はプレビュー)

Gemini 3.5 Flash - 高速・低価格でコーディングとエージェントを強化(Pro はプレビュー)

作成日:
読了:7
更新日:

Google の高速モデル系列に Gemini 3.5 Flash が加わりました(2026年5月19日 I/O で一般提供開始)。速くて安く、コーディングとエージェントで前世代を伸ばしたのが要点です。一方で話題の Gemini 3.5 Pro はまだ GA していません。この記事では、Google 公式情報を一次ソースに、Flash の実力と Pro の現状を正確に整理します。

Gemini 3.5 Flash とは

  • 2026年5月19日に GA(Gemini アプリ / Gemini API / AI Studio / Vertex AI / Android Studio など)
  • モデルID は gemini-3.5-flash(サフィックス無し=安定版)
  • 1Mトークン(1,048,576)の入力コンテキスト、最大出力 65,536 トークン
  • 入力はテキスト・画像・動画・音声・PDFに対応(出力はテキスト)
  • thinking(推論)は4段階(minimal / low / medium / high、既定 medium)
  • 知識カットオフは 2025年1月

スペックと価格

項目
GA日2026年5月19日
入力コンテキスト約1Mトークン
最大出力65,536トークン
thinking4段階(既定 medium)
入力価格$1.50 / 1Mトークン
出力価格$9.00 / 1Mトークン

WARNING

価格は 3.1 Flash の3倍です。 Gemini 3.1 Flash は入力 $0.50 / 出力 $3.00 でした。性能は上がっていますが、コスト最重視なら 3.1 Flash 系(や Flash-Lite)も依然選択肢です。用途に対して「速度・品質・価格」のどれを取るかで選びましょう。

何が伸びたのか(コーディング・エージェント)

公式は「出力トークン/秒が他のフロンティアモデル比で4倍速」(比較表現で、絶対値は非公開)とし、難しいコーディング/エージェント系ベンチで前世代を上回るとしています。

ベンチ3.5 Flash3 Flash(前世代)
Terminal-Bench 2.176.2%58.0%
MCP Atlas(エージェント)83.6%62.0%
SWE-Bench Pro55.1%49.6%

NOTE

モデルカードの比較は主に Gemini 3 Flash(前世代)に対するものです。「3.1 Pro を上回る」という主張は MCP Atlas や Finance Agent などコーディング/エージェント系の一部ベンチに限った話で、あらゆる性能で上回るという意味ではありません。前世代の Flash 系はGemini 3.1 Flash(Live / TTS)も参照。

ツール利用(function calling・code execution・file search・structured outputs・search grounding・URL context など)に対応し、エージェント用途を意識した構成です。

Gemini 3.5 Pro の現状(GA ではない)

ここは取り違えやすいので明確に。

WARNING

Gemini 3.5 Pro はまだ一般提供(GA)されていません(2026年6月24日時点)。 I/O で「翌月(6月)にロールアウト予定」と予告され、現在は Vertex AI のエンタープライズ向け限定プレビューのみ。一般 API・AI Studio の通常モデルピッカー・消費者向けアプリには未提供です。

予告されている特長は 2MトークンのコンテキストDeep Think 推論。具体的な GA 日・モデルID・価格は公式未発表です(流れている価格は二次情報の推定)。「Pro が出た」という記述は現時点では誤りなので注意してください。

使い方

API ではモデルID gemini-3.5-flash を指定するだけです。AI Studio(Antigravity)や Vertex AI からも利用できます。バッチ(50%割引)・キャッシング・thinking レベル指定にも対応します。

オープンウェイト系と比べたい場合は、コーディング特化のGLM-5.2や、軽量・拡散方式のDiffusionGemmaも合わせてどうぞ。

まとめ

  • Gemini 3.5 Flash は2026年5月19日に GAgemini-3.5-flash、1Mコンテキスト、4段階 thinking、知識カットオフ2025年1月
  • コーディング/エージェント系ベンチで前世代を大きく改善(Terminal-Bench・MCP Atlas など)。「4倍速」は対フロンティアの比較表現
  • 価格は 入力$1.50 / 出力$9.00。ただし 3.1 Flash の3倍なので、コスト重視は下位 Flash も検討
  • Gemini 3.5 Pro は未 GA(限定プレビュー)。2Mコンテキスト・Deep Think は予告段階で、GA日・価格は未発表

速くて賢い Flash が一段強くなり、エージェント用途の選択肢が増えました。ただし値上げPro 未提供は要注意。まずは Flash を実タスクで試し、Pro は GA を待つ、が現実的な構えです。

参考リンク

GLM-5.2 - GPT-5.5を一部上回るMITオープンウェイトのコーディングモデル(1Mコンテキスト)

GLM-5.2 - GPT-5.5を一部上回るMITオープンウェイトのコーディングモデル(1Mコンテキスト)

7

Zhipu AI(Z.ai)が2026年6月13日に公開した GLM-5.2 は、ウェイトを MIT ライセンスで配布する 744B 規模(アクティブ約40B)の MoE コーディングモデルです。1M トークンのコンテキスト、SWE-bench Pro 62.1 でオープンウェイトとして初めて GPT-5.5 を上回ったとされる評価、GPT-5.5 比でおよそ1/6という API 価格、ローカル実行(量子化)まで、Z.ai 公式・Hugging Face を一次ソースに、誇張せず注意点込みで整理します。

Google DiffusionGemma - 拡散モデルでテキストを「並列生成」する実験的オープンモデル

Google DiffusionGemma - 拡散モデルでテキストを「並列生成」する実験的オープンモデル

8

Google DeepMind が2026年6月10日に公開した DiffusionGemma は、テキストを1トークンずつ左から右へ生成する従来の自己回帰(autoregressive)方式ではなく、ノイズから複数トークンを並列にデノイズして生成する「拡散(diffusion)」方式のオープンウェイトモデルです。仕組み(Uniform State Diffusion・双方向アテンション・256トークンの並列デノイズ)、H100で1,000トークン/秒超という速度、Gemma 4 比での品質トレードオフ、実験的という位置づけまで、Google 公式情報を一次ソースに整理します。

Google I/O 2026 開発者視点まとめ - Antigravity 2.0、Gemini 3.5 Flash、Managed Agents、AI Studio の Android 対応

Google I/O 2026 開発者視点まとめ - Antigravity 2.0、Gemini 3.5 Flash、Managed Agents、AI Studio の Android 対応

10

2026年5月19日のGoogle I/O 2026から、開発者に効く発表を整理。エージェント開発プラットフォーム Antigravity 2.0、Gemini 3.5 Flash、API1コールのManaged Agents、AI Studioのネイティブ Android(Kotlin)対応、そして Gemini CLI 統合の意味を解説します。