
Claude Code 作者 Boris Cherny のインタビューが面白い - 「コードの8割をAIが書く」現場と印刷機の比喩
The Pragmatic Engineer(Gergely Orosz)の動画に、Claude Code の作者であり Anthropic の Head of Claude Code、Boris Cherny が登場したインタビューがとても面白かったので紹介します。タイトルは「Building Claude Code with Boris Cherny」、約1時間38分。AI でコードを書く時代の「現場の実感」が、当事者の口から具体的に語られる回でした。
以下は、私が特に印象に残った点のまとめです(内容はインタビューでの Boris の発言に基づきます)。
「最初のPRが手書きだったので却下された」
話は、Boris が Anthropic に入社した直後のエピソードから始まります。最初のプルリクエストを手書き(自分で書いた)で出したところ、却下されたというのです。理由は「品質が悪い」からではなく、手書きだったから。代わりに、Claude Code の前身となる社内ツール「Clyde」を使うよう言われます。
Clyde は起動に40秒かかる Python の研究用コードでしたが、丁寧にプロンプトを与えると動く PR を一発で生成した。これが Boris にとって最初の「AGI を感じた瞬間」だったと言います。次の瞬間は、tool use が出た直後に bash ツールを1つだけ与えて「いま何の音楽を聴いている?」と尋ねたら、Sonnet 3.5 が AppleScript を書いて音楽プレイヤーに問い合わせてみせたとき。ここから Claude Code の原型が生まれていきます。
Anthropic ではコードの約8割を Claude Code が書く
インタビューで何度か出てくる象徴的な数字が、「いま Anthropic ではコードのおよそ80%を Claude Code が書いている」というもの。技術系の従業員はほぼ全員が毎日 Claude Code を使い、営業など非技術系にも急速に広がっているそうです。
Dario Amodei(CEO)から「使うよう強制しているのか?」と聞かれた Boris は、「ツールを提供して、人々が足で投票しただけ」と答えたといいます。なお Claude Code は公開直後から大ヒットだったわけではなく、本当の転換点は2025年5月の Opus 4 / Sonnet 4 リリースで、そこから指数関数的に伸びたとのことです。
1日20〜30本のPRを手書きゼロで
Boris 自身のワークフローが具体的で面白い。要点はこうです。
- ターミナルタブを5枚開き、それぞれ別のリポジトリで Claude Code を plan mode で起動し、ラウンドロビンで回す
- あふれた分は Web 版やデスクトップアプリへ。毎朝 iOS アプリでクラウド実行のエージェントを数本起動してから1日を始める
- コードの3分の1から半分は携帯から書いているかもしれない、という
- 進め方の核心は「計画が固まるまで plan mode で往復する。計画さえ正しければ、実装はほぼ毎回一発で通る」
Opus 4.5 のドッグフーディングを始めたタイミングで手書きをやめ、IDE をアンインストールしたそうです。ある月は毎日10〜20本の PR をすべて Claude Code が書き、1ヶ月でモデル起因のバグは2件程度。「手書きなら20件は入れていただろう」と振り返ります。この「計画を詰めてから自走させる」発想は、Claude Code を長時間自律で走らせるで整理した方向性とよく重なります。
AI 時代のコードレビューはどう変わったか
「では品質はどう担保するのか」が当然の疑問になりますが、ここが多層的でした。Boris は Meta 時代に最多クラスのコードレビュアーで、指摘をスプレッドシートに記録し「3〜4回同じ指摘が出たら lint ルール化して自動化する」人だったといいます。その哲学が、いまの多層レビューに繋がっています。
- Claude がローカルでテストを実行・追加する(Claude Code 自身の開発では、Claude がサブプロセスで自分自身を起動して end-to-end の自己テストまでやる)
- CI で
claude -p(Claude Agent SDK)が全 PR をレビューし、バグの約80%をこの段階で捕捉。自動で直すものと、判断に迷い人間に残すものを分ける - 必ず人間のエンジニアが2次レビューし、承認のループには人間が残る
LLM レビューの非決定性に対しては、型チェッカー・linter・ビルドといった決定的なチェックを併用。社内のレビュー用 skill はオープンソースで、並列エージェントでレビューし、別の並列エージェントで偽陽性を除去する best-of-N 構成だといいます。「人間レビューを省けるのは個人のサイドプロジェクト程度で、エンタープライズではセキュリティ・プライバシーのバーがあるので当面は人間がループに残る」という線引きも現実的でした。
2つの設計思想: 「モデルを箱に入れるな」と agentic search
技術判断として印象的だったのが2つ。
ひとつは 「モデルを箱に入れるな(Don't put it in a box)」。モデルをシステムの一部品としてスタブ化するのではなく、モデル自体を主体に置き、ツールやプログラムを与えて自由に使わせるべき、という考え方です。Boris はこれを「bitter lesson の系(corollary)」だと表現します。
もうひとつが 検索の作り方。初期の Claude Code はローカルのベクタ DB を使う RAG で検索していましたが、ローカルの新規コードがインデックスに反映されない同期ずれや、インデックスのアクセス権限管理といった問題があった。いろいろ試した結果、最終的に「agentic search」が全てを上回った。そして Boris は、その agentic search の正体を「glob と grep の格好いい言い方にすぎない」と笑います。凝った仕組みより、モデルに glob と grep を使わせるほうが強かった、という話です。
NOTE
「試したものの大半は捨てる」のが前提の文化だそうです。スピナー1つに100回近いイテレーションを重ね、本番に残ったのは10〜20、残りは捨てた、と。「コードを書くコストが下がったので、書いて試して感触を確かめ、ほとんど捨てる」のが統計的に普通になった——というのが、AI 時代の開発のリアルな手触りでした。
プロトタイプ文化: PRD なし、数百作って捨てる
開発スタイルも独特です。PRD(製品要求文書)はほぼ書かない。「文書より先に PR を送るほうがよい」という文化で、動くプロトタイプを大量に作って感触を確かめる。ToDo リスト機能では1日半で15〜20個の動くプロトタイプを作り、agent teams(swarm)は数ヶ月かけて数百バージョンを試作してから出荷したそうです。
象徴的なのが plugins 機能で、ある開発者が週末に swarm の初期版を使い「仕様を作り、タスクに分割し、エージェントたちで実装せよ」と指示したところ、数百のエージェントが約100タスクを実装し、それがほぼそのまま出荷されたとのこと。プラグインの仕組みの裏にこういう作り方があったのか、と妙に納得しました。
「印刷機」の比喩
このインタビューで一番心に残ったのが、現在を1400年代の印刷機の発明になぞらえる視点です。
Boris の整理はこうです。かつて読み書きは人口の1%未満のエリート(写字生)の技能で、彼らを雇う王自身が文字を読めないこともあった。印刷機の登場で印刷物のコストは大きく下がり、量は桁違いに増え、識字率は数百年かけて上がっていった。写字生という職業は消えたが、代わりに「作家・著者」という職業が生まれ、文学市場そのものが爆発的に拡大した。
そして現在、「ビジネスオーナーがコードを書けないからエンジニアを雇う」という構図は、文字を読めない王が写字生を雇った構図に重なる、と。印刷機の時代に「いずれマイクという職業が生まれる」と予測できた人がいなかったように、この移行の先に何が生まれるかは予測不可能で、そこが最も面白いのだと語ります。
ホストの Gergely が「コーディングが上手くなるために費やした努力と、それに結びついたアイデンティティが、想像より早く奪われたことへの喪失感」を率直に語る場面もあり、単なる楽観論ではなく、その喪失をきちんと見据えたうえでの希望として響きました。
これから価値が上がるスキル・下がるスキル
最後に、スキルの話も具体的でした。
- 捨ててよいもの: コードスタイルや言語・フレームワークをめぐる強い意見と論争。モデルがどの言語でも書け、気に入らなければ書き直せるので、もう重要ではない
- 依然として重要: 方法論的・仮説駆動であること(製品設計でもデバッグでも効く)
- 価値が上がるもの: 好奇心と、自分のレーンを越えて動けること。エンジニアリングと事業、デザインと財務などを横断できる「ハイブリッド」がますます報われ、「今年はジェネラリストの年」になる
Boris は冗談めかして「短い注意スパンも報われる年」とも言います。仕事の中心が深い集中から「複数の Claude を管理してコンテキストスイッチする」ことに変わったからです。Gergely はこれに「適応力(adaptability)」を付け加えていました。次のモデルが出ればまた全部変わる、それだけが確実だからです。
まとめ
- Claude Code 作者 Boris Cherny のインタビュー。「最初のPRが手書きだったので却下された」話から、AI でコードを書く現場の実感が具体的に語られる
- Anthropic ではコードの約8割を Claude Code が書く。Boris は1日20〜30本の PR を手書きゼロで出す
- 品質は多層レビュー(Claude のテスト → CI で
claude -pが8割バグ捕捉 → 人間の2次レビュー)と決定的チェックの併用で担保 - 設計思想は「モデルを箱に入れるな」と、RAG を捨てて agentic search(=glob と grep)。試作の大半は捨てる文化
- 現在を「印刷機」になぞらえ、写字生(エンジニア)は消えるのではなく「作家」へ——その先は予測不能で面白い、とする
- 価値が上がるのは好奇心・越境・適応力。「ジェネラリストの年」
AI コーディングのツールを作っている当事者が、過剰な煽りも悲観もなく「いま何が起きているか」を語る回でした。Claude Code を日々使っている人なら、設計判断の背景や開発文化の話だけでも見る価値があります。