Claude Code 作者 Boris Cherny のインタビューが面白い - 「コードの8割をAIが書く」現場と印刷機の比喩

The Pragmatic Engineer（Gergely Orosz）の動画に、Claude Code の作者であり Anthropic の Head of Claude Code、Boris Cherny が登場したインタビューがとても面白かったので紹介します。タイトルは「Building Claude Code with Boris Cherny」、約1時間38分。AI でコードを書く時代の「現場の実感」が、当事者の口から具体的に語られる回でした。

以下は、私が特に印象に残った点のまとめです（内容はインタビューでの Boris の発言に基づきます）。

「最初のPRが手書きだったので却下された」

話は、Boris が Anthropic に入社した直後のエピソードから始まります。最初のプルリクエストを手書き（自分で書いた）で出したところ、却下されたというのです。理由は「品質が悪い」からではなく、手書きだったから。代わりに、Claude Code の前身となる社内ツール「Clyde」を使うよう言われます。

Clyde は起動に40秒かかる Python の研究用コードでしたが、丁寧にプロンプトを与えると動く PR を一発で生成した。これが Boris にとって最初の「AGI を感じた瞬間」だったと言います。次の瞬間は、tool use が出た直後に bash ツールを1つだけ与えて「いま何の音楽を聴いている?」と尋ねたら、Sonnet 3.5 が AppleScript を書いて音楽プレイヤーに問い合わせてみせたとき。ここから Claude Code の原型が生まれていきます。

Anthropic ではコードの約8割を Claude Code が書く

インタビューで何度か出てくる象徴的な数字が、「いま Anthropic ではコードのおよそ80%を Claude Code が書いている」というもの。技術系の従業員はほぼ全員が毎日 Claude Code を使い、営業など非技術系にも急速に広がっているそうです。

Dario Amodei（CEO）から「使うよう強制しているのか?」と聞かれた Boris は、「ツールを提供して、人々が足で投票しただけ」と答えたといいます。なお Claude Code は公開直後から大ヒットだったわけではなく、本当の転換点は2025年5月の Opus 4 / Sonnet 4 リリースで、そこから指数関数的に伸びたとのことです。

1日20〜30本のPRを手書きゼロで

Boris 自身のワークフローが具体的で面白い。要点はこうです。

ターミナルタブを5枚開き、それぞれ別のリポジトリで Claude Code を plan mode で起動し、ラウンドロビンで回す
あふれた分は Web 版やデスクトップアプリへ。毎朝 iOS アプリでクラウド実行のエージェントを数本起動してから1日を始める
コードの3分の1から半分は携帯から書いているかもしれない、という
進め方の核心は「計画が固まるまで plan mode で往復する。計画さえ正しければ、実装はほぼ毎回一発で通る」

Opus 4.5 のドッグフーディングを始めたタイミングで手書きをやめ、IDE をアンインストールしたそうです。ある月は毎日10〜20本の PR をすべて Claude Code が書き、1ヶ月でモデル起因のバグは2件程度。「手書きなら20件は入れていただろう」と振り返ります。この「計画を詰めてから自走させる」発想は、Claude Code を長時間自律で走らせるで整理した方向性とよく重なります。

AI 時代のコードレビューはどう変わったか

「では品質はどう担保するのか」が当然の疑問になりますが、ここが多層的でした。Boris は Meta 時代に最多クラスのコードレビュアーで、指摘をスプレッドシートに記録し「3〜4回同じ指摘が出たら lint ルール化して自動化する」人だったといいます。その哲学が、いまの多層レビューに繋がっています。

Claude がローカルでテストを実行・追加する（Claude Code 自身の開発では、Claude がサブプロセスで自分自身を起動して end-to-end の自己テストまでやる）
CI で claude -p（Claude Agent SDK）が全 PR をレビューし、バグの約80%をこの段階で捕捉。自動で直すものと、判断に迷い人間に残すものを分ける
必ず人間のエンジニアが2次レビューし、承認のループには人間が残る

LLM レビューの非決定性に対しては、型チェッカー・linter・ビルドといった決定的なチェックを併用。社内のレビュー用 skill はオープンソースで、並列エージェントでレビューし、別の並列エージェントで偽陽性を除去する best-of-N 構成だといいます。「人間レビューを省けるのは個人のサイドプロジェクト程度で、エンタープライズではセキュリティ・プライバシーのバーがあるので当面は人間がループに残る」という線引きも現実的でした。

2つの設計思想: 「モデルを箱に入れるな」と agentic search

技術判断として印象的だったのが2つ。

ひとつは 「モデルを箱に入れるな（Don't put it in a box）」。モデルをシステムの一部品としてスタブ化するのではなく、モデル自体を主体に置き、ツールやプログラムを与えて自由に使わせるべき、という考え方です。Boris はこれを「bitter lesson の系（corollary）」だと表現します。

もうひとつが 検索の作り方。初期の Claude Code はローカルのベクタ DB を使う RAG で検索していましたが、ローカルの新規コードがインデックスに反映されない同期ずれや、インデックスのアクセス権限管理といった問題があった。いろいろ試した結果、最終的に「agentic search」が全てを上回った。そして Boris は、その agentic search の正体を「glob と grep の格好いい言い方にすぎない」と笑います。凝った仕組みより、モデルに glob と grep を使わせるほうが強かった、という話です。

NOTE

「試したものの大半は捨てる」のが前提の文化だそうです。スピナー1つに100回近いイテレーションを重ね、本番に残ったのは10〜20、残りは捨てた、と。「コードを書くコストが下がったので、書いて試して感触を確かめ、ほとんど捨てる」のが統計的に普通になった——というのが、AI 時代の開発のリアルな手触りでした。

プロトタイプ文化: PRD なし、数百作って捨てる

開発スタイルも独特です。PRD（製品要求文書）はほぼ書かない。「文書より先に PR を送るほうがよい」という文化で、動くプロトタイプを大量に作って感触を確かめる。ToDo リスト機能では1日半で15〜20個の動くプロトタイプを作り、agent teams（swarm）は数ヶ月かけて数百バージョンを試作してから出荷したそうです。

象徴的なのが plugins 機能で、ある開発者が週末に swarm の初期版を使い「仕様を作り、タスクに分割し、エージェントたちで実装せよ」と指示したところ、数百のエージェントが約100タスクを実装し、それがほぼそのまま出荷されたとのこと。プラグインの仕組みの裏にこういう作り方があったのか、と妙に納得しました。

「印刷機」の比喩

このインタビューで一番心に残ったのが、現在を1400年代の印刷機の発明になぞらえる視点です。

Boris の整理はこうです。かつて読み書きは人口の1%未満のエリート（写字生）の技能で、彼らを雇う王自身が文字を読めないこともあった。印刷機の登場で印刷物のコストは大きく下がり、量は桁違いに増え、識字率は数百年かけて上がっていった。写字生という職業は消えたが、代わりに「作家・著者」という職業が生まれ、文学市場そのものが爆発的に拡大した。

そして現在、「ビジネスオーナーがコードを書けないからエンジニアを雇う」という構図は、文字を読めない王が写字生を雇った構図に重なる、と。印刷機の時代に「いずれマイクという職業が生まれる」と予測できた人がいなかったように、この移行の先に何が生まれるかは予測不可能で、そこが最も面白いのだと語ります。

ホストの Gergely が「コーディングが上手くなるために費やした努力と、それに結びついたアイデンティティが、想像より早く奪われたことへの喪失感」を率直に語る場面もあり、単なる楽観論ではなく、その喪失をきちんと見据えたうえでの希望として響きました。

これから価値が上がるスキル・下がるスキル

最後に、スキルの話も具体的でした。

捨ててよいもの: コードスタイルや言語・フレームワークをめぐる強い意見と論争。モデルがどの言語でも書け、気に入らなければ書き直せるので、もう重要ではない
依然として重要: 方法論的・仮説駆動であること（製品設計でもデバッグでも効く）
価値が上がるもの: 好奇心と、自分のレーンを越えて動けること。エンジニアリングと事業、デザインと財務などを横断できる「ハイブリッド」がますます報われ、「今年はジェネラリストの年」になる

Boris は冗談めかして「短い注意スパンも報われる年」とも言います。仕事の中心が深い集中から「複数の Claude を管理してコンテキストスイッチする」ことに変わったからです。Gergely はこれに「適応力（adaptability）」を付け加えていました。次のモデルが出ればまた全部変わる、それだけが確実だからです。

まとめ

Claude Code 作者 Boris Cherny のインタビュー。「最初のPRが手書きだったので却下された」話から、AI でコードを書く現場の実感が具体的に語られる
Anthropic ではコードの約8割を Claude Code が書く。Boris は1日20〜30本の PR を手書きゼロで出す
品質は多層レビュー（Claude のテスト → CI で claude -p が8割バグ捕捉 → 人間の2次レビュー）と決定的チェックの併用で担保
設計思想は「モデルを箱に入れるな」と、RAG を捨てて agentic search（＝glob と grep）。試作の大半は捨てる文化
現在を「印刷機」になぞらえ、写字生（エンジニア）は消えるのではなく「作家」へ——その先は予測不能で面白い、とする
価値が上がるのは好奇心・越境・適応力。「ジェネラリストの年」

AI コーディングのツールを作っている当事者が、過剰な煽りも悲観もなく「いま何が起きているか」を語る回でした。Claude Code を日々使っている人なら、設計判断の背景や開発文化の話だけでも見る価値があります。

Claude Code 作者 Boris Cherny のインタビューが面白い - 「コードの8割をAIが書く」現場と印刷機の比喩

「最初のPRが手書きだったので却下された」

Anthropic ではコードの約8割を Claude Code が書く

1日20〜30本のPRを手書きゼロで

AI 時代のコードレビューはどう変わったか

2つの設計思想: 「モデルを箱に入れるな」と agentic search

プロトタイプ文化: PRD なし、数百作って捨てる

「印刷機」の比喩

これから価値が上がるスキル・下がるスキル

まとめ

参考リンク

Claude Opus 4.8 リリースまとめ — Dynamic Workflows と effort control、4.7 からの強化点と価格

Codex Plugin for Claude Code 入門 - Claude Code から Codex にレビューとタスクを任せる

Claude Fable 5 とは何か - Opus を超える「Mythos クラス」を安全に公開する仕組み

「最初のPRが手書きだったので却下された」

Anthropic ではコードの約8割を Claude Code が書く

1日20〜30本のPRを手書きゼロで

AI 時代のコードレビューはどう変わったか

2つの設計思想: 「モデルを箱に入れるな」と agentic search

プロトタイプ文化: PRD なし、数百作って捨てる

「印刷機」の比喩

これから価値が上がるスキル・下がるスキル

まとめ

参考リンク

関連記事

Claude Opus 4.8 リリースまとめ — Dynamic Workflows と effort control、4.7 からの強化点と価格

Codex Plugin for Claude Code 入門 - Claude Code から Codex にレビューとタスクを任せる

Claude Fable 5 とは何か - Opus を超える「Mythos クラス」を安全に公開する仕組み