Gemini 3.5 Flash - 高速・低価格でコーディングとエージェントを強化（Pro はプレビュー）

Google の高速モデル系列に Gemini 3.5 Flash が加わりました（2026年5月19日 I/O で一般提供開始）。速くて安く、コーディングとエージェントで前世代を伸ばしたのが要点です。一方で話題の Gemini 3.5 Pro はまだ GA していません。この記事では、Google 公式情報を一次ソースに、Flash の実力と Pro の現状を正確に整理します。

Gemini 3.5 Flash とは

2026年5月19日に GA（Gemini アプリ / Gemini API / AI Studio / Vertex AI / Android Studio など）
モデルID は gemini-3.5-flash（サフィックス無し＝安定版）
1Mトークン（1,048,576）の入力コンテキスト、最大出力 65,536 トークン
入力はテキスト・画像・動画・音声・PDFに対応（出力はテキスト）
thinking（推論）は4段階（minimal / low / medium / high、既定 medium）
知識カットオフは 2025年1月

スペックと価格

項目	値
GA日	2026年5月19日
入力コンテキスト	約1Mトークン
最大出力	65,536トークン
thinking	4段階（既定 medium）
入力価格	$1.50 / 1Mトークン
出力価格	$9.00 / 1Mトークン

WARNING

価格は 3.1 Flash の3倍です。 Gemini 3.1 Flash は入力 $0.50 / 出力 $3.00 でした。性能は上がっていますが、コスト最重視なら 3.1 Flash 系（や Flash-Lite）も依然選択肢です。用途に対して「速度・品質・価格」のどれを取るかで選びましょう。

何が伸びたのか（コーディング・エージェント）

公式は「出力トークン/秒が他のフロンティアモデル比で4倍速」（比較表現で、絶対値は非公開）とし、難しいコーディング/エージェント系ベンチで前世代を上回るとしています。

ベンチ	3.5 Flash	3 Flash（前世代）
Terminal-Bench 2.1	76.2%	58.0%
MCP Atlas（エージェント）	83.6%	62.0%
SWE-Bench Pro	55.1%	49.6%

NOTE

モデルカードの比較は主に Gemini 3 Flash（前世代）に対するものです。「3.1 Pro を上回る」という主張は MCP Atlas や Finance Agent などコーディング/エージェント系の一部ベンチに限った話で、あらゆる性能で上回るという意味ではありません。前世代の Flash 系はGemini 3.1 Flash（Live / TTS）も参照。

ツール利用（function calling・code execution・file search・structured outputs・search grounding・URL context など）に対応し、エージェント用途を意識した構成です。

Gemini 3.5 Pro の現状（GA ではない）

ここは取り違えやすいので明確に。

WARNING

Gemini 3.5 Pro はまだ一般提供（GA）されていません（2026年6月24日時点）。 I/O で「翌月（6月）にロールアウト予定」と予告され、現在は Vertex AI のエンタープライズ向け限定プレビューのみ。一般 API・AI Studio の通常モデルピッカー・消費者向けアプリには未提供です。

予告されている特長は 2Mトークンのコンテキストと Deep Think 推論。具体的な GA 日・モデルID・価格は公式未発表です（流れている価格は二次情報の推定）。「Pro が出た」という記述は現時点では誤りなので注意してください。

使い方

API ではモデルID gemini-3.5-flash を指定するだけです。AI Studio（Antigravity）や Vertex AI からも利用できます。バッチ（50%割引）・キャッシング・thinking レベル指定にも対応します。

オープンウェイト系と比べたい場合は、コーディング特化のGLM-5.2や、軽量・拡散方式のDiffusionGemmaも合わせてどうぞ。

まとめ

Gemini 3.5 Flash は2026年5月19日に GA。gemini-3.5-flash、1Mコンテキスト、4段階 thinking、知識カットオフ2025年1月
コーディング/エージェント系ベンチで前世代を大きく改善（Terminal-Bench・MCP Atlas など）。「4倍速」は対フロンティアの比較表現
価格は 入力$1.50 / 出力$9.00。ただし 3.1 Flash の3倍なので、コスト重視は下位 Flash も検討
Gemini 3.5 Pro は未 GA（限定プレビュー）。2Mコンテキスト・Deep Think は予告段階で、GA日・価格は未発表

速くて賢い Flash が一段強くなり、エージェント用途の選択肢が増えました。ただし値上げと Pro 未提供は要注意。まずは Flash を実タスクで試し、Pro は GA を待つ、が現実的な構えです。

Gemini 3.5 Flash - 高速・低価格でコーディングとエージェントを強化（Pro はプレビュー）

Gemini 3.5 Flash とは

スペックと価格

何が伸びたのか（コーディング・エージェント）

Gemini 3.5 Pro の現状（GA ではない）

使い方

まとめ

参考リンク

GLM-5.2 - GPT-5.5を一部上回るMITオープンウェイトのコーディングモデル（1Mコンテキスト）

Google DiffusionGemma - 拡散モデルでテキストを「並列生成」する実験的オープンモデル

Google I/O 2026 開発者視点まとめ - Antigravity 2.0、Gemini 3.5 Flash、Managed Agents、AI Studio の Android 対応

Gemini 3.5 Flash とは

スペックと価格

何が伸びたのか（コーディング・エージェント）

Gemini 3.5 Pro の現状（GA ではない）

使い方

まとめ

参考リンク

関連記事

GLM-5.2 - GPT-5.5を一部上回るMITオープンウェイトのコーディングモデル（1Mコンテキスト）

Google DiffusionGemma - 拡散モデルでテキストを「並列生成」する実験的オープンモデル

Google I/O 2026 開発者視点まとめ - Antigravity 2.0、Gemini 3.5 Flash、Managed Agents、AI Studio の Android 対応