AnthropicがサンフランシスコからLondonに舞台を移して初めて開催した「Code with Claude London 2026」。Claude Code完全ガイド2026:インストールから本番運用まで

その基調講演(46分)には、開発者が今すぐ実装できる新機能から、モデルが「時間単位」で自律稼働する未来まで、Anthropicが考えるAI開発の全体像が凝縮されていた。

この記事でわかること

  • Boris Chernvy(プロダクト担当VP)が語るモデル能力の指数関数的成長と現実の線形採用のギャップ
  • Lisa(Research PM)による「タスクホライゾン」論と開発者が今すべき3つの準備
  • Claude Platform: Advisor戦略・Self-hosted Sandbox・MCP Tunnelsの仕組み
  • Claude Code: Routines・CI Autofix・Desktop App・Agents Viewの全機能
  • Spotify・Mercado Libre・Shopifyの実採用事例と具体的な数字
  • 「Claudeがプロンプトを書く高階関数」という新しいプログラミングパラダイム
Boris Chernvy が基調講演を行うステージ
図: Boris Chernvy(Claude Code プロダクト担当VP)がロンドンのオーディエンスに語りかける

「電卓プログラミング」から始まった話 — 距離の崩壊

基調講演の冒頭、Boris Chernvy は自身が最初にプログラミングを学んだのはTI-83電卓だったと明かした。数学のテストをパスするために電卓にプログラムを書き、クラスメートにも教え、やがてネット上にガイドを公開した。当時13歳。「魔法みたいだった」と表現する。

その後も同じ動機で、eBayのポケモンカード出品ページをHTMLで綺麗に見せるためだけに学んだ。テーブル、点滅テキスト、全部入り。3枚のホログラフィックな「伝説の鳥」を99セントで売った(「今思えば持っておくべきだったが」)。

「私たちは教科書からではなく、いじくり回すことで学んだ世代だ。プログラムが動いたとき、作りたいものが作れたとき——その高揚感を今も覚えている」

しかしいつの間にか、プログラミングは複雑になった。コンパイラ、型チェッカー、ビルドシステム、パッケージマネージャ、1行のコードを書く前に12個の設定ファイル。「アイデアを持ってから動くものができるまでの距離」がどんどん伸びた。

今、その距離が崩壊しつつある。

問題を説明すればプログラムが現れる。電卓の感覚で、ただし電卓が分散システムを書ける。Boris はそう表現し、ロンドンの開発者たちに「あのとき感じた魔法を、あなたたちも毎日経験しているはずだ」と語りかけた。

指数と線形のギャップ — なぜ今ここにいるのか

Claudeの能力曲線を示すスライド
図: 「Claude drafts a commit message」という点から始まる指数的成長の曲線

Boris は過去2年間の能力の変遷を時系列で示した。

  • 2年前: Claudeはgit commitのメッセージをうまく下書きできるレベル
  • 1年前(第1回Code with Claudeサンフランシスコ): Opus 4が登場し「数分間動いて機能全体を作る」という概念が登場。「人間が確認しなくてもいい」という発想が「クレイジー」と受け取られていた
  • 半年前: エージェントが一晩中動き、起きたら仕事が終わっている状態
  • 先月: Mythos(最新モデル)がOpenBSD全ソースツリーを読んで27年前から存在していた脆弱性を発見。人間のレビュアー、ファジャー、静的解析ツールのどれも3十年近く見逃していたもの

「ジャンプはどんどん大きくなり、間隔はどんどん短くなっている。」

しかしモデル能力が指数的に伸びている一方で、多くの組織はまだ線形のペースでAIを採用している。このギャップを埋め、モデル能力を現実のビジネス価値に変換するのが開発者の役割だという。

その証拠として示されたのが、ClaudeプラットフォームのAPI呼び出し量が前年比で約17倍に増加したという数字。Claude Codeでは平均的な開発者が週20時間以上Claudeを稼働させている。

3つのユースケース:スピードだけが目的ではない

Spotify: Nicholas Gustaffsonが率いるチームが「Migration Agent」を構築。自然言語で書かれたマイグレーション手順書を読んでエージェントの群れがPRを開く。現在月1,000件以上のPRを本番にマージ、マイグレーション時間を90%以上削減。

Binty: Felicia CoruruがCEOを務める里親支援SaaS。Quad APIでケースワーカーの書類作業を自動化。里親ライセンス取得プロセスから20日間を短縮。「効率化の指標ではなく、子どもが家族と繋がるまでの時間」だと強調。

Anthropic社内: APIボリューム17x増。Claude Codeの週平均稼働20時間超。

Part 1: モデル層 — Lisaが語る「タスクホライゾン」論

Lisa(Research PM)が登壇する様子
図: Lisa(Research PM)。Claude 3以降すべてのモデルローンチに関わり17バージョンをリリースしてきた

Research PMのLisaは、Claudeの歴史を能力のマイルストーンで振り返った。

モデル 主要マイルストーン
Opus 3(2年前) 長文コードの記述が初めて実用的に
Sonnet 3.5 / 3.6 コンピュータの安全な使用(Computer use)が初めて可能に
Sonnet 3.7 回答前に考えを巡らせる(Extended thinking)
Opus 4(昨年のCode with Claudeで発表) 複雑なExcel・PowerPointを書ける
Opus 4.7 / Mythos preview 高い曖昧さの中でも目標を自律達成できる

「過去12ヶ月でフロンティアモデルを8本出荷した。それぞれが前のモデルを土台にしている。」

Claudeの6つの主要能力: Tool use, Computer use, Adaptive thinking, Agentic loops, Long context, Visual design
図: AnthropicがパイオニアしてきたClaudeの6つのコア能力。それぞれが「Claudeがこれをできなかった時代」から「最も長く信頼性を磨いてきた」強みになっている

Lisaが強調したのは、AnthropicはツールUse・Computer use・Extended thinking・Agentic loops・Long context・Visual designの各領域を業界で初めて実装してきた——そして「最初に出した」ことで「最も長く信頼性を磨いてきた」という事実だ。

タスクホライゾンとは何か

Lisaが提唱する「タスクホライゾン」は、モデルがどれだけ長く脱線せずに作業できるかを測る指標だ。

  • 1年前: 信頼できる稼働時間は「分単位」
  • 現在: ほとんどのユーザーが「時間単位」のエージェントを稼働
  • 近い将来: 継続的に稼働するエージェント

「継続的に稼働するエージェント」とは、言われなくてもやることを知っていて、プロアクティブに動き、高レベルの目標を責任を持って達成するものだ。Lisaはその具体例を2つ挙げた。

「Claude、プロジェクト進捗レポートを書いて」ではなく「Claude、今週プロジェクトを軌道に乗せておいて」

「財務予測を出して」ではなく「財務予測を正確に保ち続けて」

開発者向けアドバイス: 1. Design for the next model, 2. Curate frontier evals
図: 指数的変化に乗るための開発者戦略。「今動くもの」ではなく「次のモデルのために設計する」

開発者が今すべき3つの準備

Lisa はキャパビリティの指数成長の波に乗るために開発者が取るべき行動を3つ挙げた。

1. 次のモデルに向けて設計する

現在のモデルではなく、次のバージョンのClaudeを前提にアーキテクチャを設計せよ。「勝つ開発者は、次の大きなジャンプを吸収できるアーキテクチャを持っている人たちだ。」

スキャフォールディング(エージェントのうちClaudeではない部分:ループ・指示・ツール)について重要な逆説を指摘した。モデルが賢くなるほど、以前は「助けになっていた」スキャフォールディングが「足を引っ張る」ようになる。 より賢いモデルは、ファイルシステムやサンドボックス環境のような汎用プリミティブがあれば、細かい制約なしにより遠くまで到達できる。

2. フロンティアレベルのEvalを磨く

「以前は失敗していたタスクが突然パスし始めたとき——それが新機能を出荷できるサインだ。」プロダクトプロトタイプとEvalの両方が、指数が自分たちの足元で動いていることを最初に教えてくれる。

3. モデルアップグレードをビジネスチャンスとして扱う

最も恩恵を受けているチームは、モデルのアップグレードをイベントとして扱う——評価を自動化し、手で触ってみて、改善された知性が自社ユーザーにどう作用するかを体感する。

Part 2: Claude Platform — 指数に乗るためのインフラ

Claude Platform発表スライド: Claude models / Claude Platform / Claude Code の3層構造
図: Anthropicの3層構造。モデル → プラットフォーム → Claude Codeという積み重ねが今日の発表の骨格

Platform担当のAngela(プロダクトマネージャー)とCaitlyn(エンジニアリングリード)は、企業がモデルの指数に乗れない2つの根本問題を指摘した。

問題1: 正しいアウトカムを得るのが難しすぎる

エージェントが「ちょうど必要なこと」をやるようにするには、プロンプト最適化・ツール構築・ハーネスエンジニアリングが必要で、やることが多すぎる。

問題2: 速く出荷しながら、スケールできる品質も必要

プロトタイプは簡単だが、本番でスケールするのは難しい。

新機能1: Advisor戦略(cost vs. intelligence tradeoff)

import anthropic

client = anthropic.Anthropic()

response = client.messages.create(
    model="claude-sonnet-4-6",   # executor: 安価なモデルが実行
    max_tokens=8096,
    tools=[
        {
            "type": "computer_20241022",
            "name": "computer",
            "display_width_px": 1024,
            "display_height_px": 768,
        }
    ],
    # Advisor戦略: tools arrayにadvisor設定を追加するだけ
    # 小さいモデルが詰まったとき、大きいモデルに助言を求める
    metadata={
        "advisor_model": "claude-opus-4-7",  # advisor: Opusが戦略的に助言
    },
    messages=[{"role": "user", "content": "このタスクを実行してください"}]
)

仕組みはシンプルだ。Messges APIの tools 配列を更新するだけで有効化できる。背後では「実行」と「助言」が分離される。

  • Executor: SonnetやHaikuクラスのモデルが実際の処理を実行(コスト低)
  • Advisor: 詰まったときだけOpusに相談(高精度の判断が必要な場面に限定)

Caitlyn は「SonnetをExecutor・OpusをAdvisorにしたところ、Sonnet単体より性能が高く、かつコストもSonnet単体より低くなった。Opusが的確な助言をして、Sonnetが最短経路を辿れるようになったから」と説明した。

Eve Legalの事例: Advisor戦略を採用し、フロンティアモデルと同等品質を5倍低コストで実現。高品質なアウトプットが必要だがコスト意識も重要なプレミアム製品(法務文書レビュー)に最適な事例。

新機能2: Claude Managed Agents — Self-Hosted Sandbox

Claude Managed Agentsは「エージェントハーネスと本番グレードのインフラのペアリング」だ。Angelaによると、利用チームは本番グレードのエージェントを数ヶ月ではなく数日で出荷できている。

今回新たに発表されたのがSelf-hosted Sandbox。Claude Managed Agentsがコードを実行する際、Anthropicのクラウドではなく、企業自身のサーバーで実行できる。

対応プロバイダー(day-one):

  • Vercel Sandbox
  • Daytona
  • Cloudflare
  • Modal

仕組みは以下の通りだ。

sequenceDiagram participant A as Claude Managed Agent participant Q as Work Queue participant V as Vercel Sandbox participant R as Company Server A->>Q: コード実行タスクをエンキュー Q->>V: ワークアイテムをピックアップ V->>R: 企業アカウント内でサンドボックス起動 R->>V: コード実行 V->>A: 実行結果を返却 Note over R: コードは常に自社インフラ内で実行

新機能3: MCP Tunnels — プライベートネットワーク内のMCPサーバー

多くの企業では、MCPサーバーがファイアウォール内のプライベートネットワークに存在する。これまでClaudeからアクセスするには公開インターネットに露出させる必要があったが、MCP Tunnelsによりプライベートネットワーク内のMCPサーバーにセキュアにアクセスできる。

# Claude Developer Console でのMCP Tunnel設定
mcp_tunnels:
  - name: "internal-data-warehouse"
    # tunnel.anthropic.com経由でプライベートMCPサーバーにアクセス
    url: "https://tunnel.anthropic.com/your-org/data-warehouse"
    # 実際のサーバーはファイアウォール内
    internal_endpoint: "https://data-warehouse.internal:8080"
    
  - name: "feature-flags-service"
    url: "https://tunnel.anthropic.com/your-org/feature-flags"
    internal_endpoint: "https://feature-flags.internal:3000"

DeveloperコンソールでGatewayを設定し、Anthropicへのセキュアな接続を確立。エージェントはtunnel.anthropic.comを経由して内部サービスにアクセスできる。

デモ: Counter社のGrowth Agent

Slackチャンネルでgrowthbotが実験結果を報告している画面
図: Counter社のSlackチャンネル。growthbotが自律的にA/B実験の勝者を判定し、クリーンアップを開始したことを報告している

AngelaとCaitlynは架空の企業「Counter」(小規模事業者向けデジタルストアフロントSaaS)のユースケースでデモを行った。

Counter社の課題: マーチャントのオンボーディングフローで継続的にA/B実験を実施しているが、実験の評価・勝者の確定・古いバリアントのクリーンアップが手動作業で重い。

Growth Agentの構成:

  • System prompt: 実験監視・判定・コードクリーンアップのタスク定義
  • MCP servers:
    • Slack(パブリックURL)
    • データウェアハウス(MCP Tunnel経由・プライベート)
    • Feature flags(MCP Tunnel経由・プライベート)
  • サンドボックス: Vercel self-hosted sandbox
Claude Managed Agentsのコンソール画面。セッション一覧とツール呼び出しのトレース
図: Claude Developer Console。エージェントのセッション詳細、ツール呼び出しのトレース、self-hosted sandboxの使用状況を確認できる

実際のデモでは:

  1. growthbotがSlackに「simplifyバリアントが明確に勝利(118%向上)」と報告
  2. 古いバリアントのクリーンアップを自律開始
  3. 「次に何をすべき?」とCaitlynが聞くと、オンボーディングフローの46%ドロップオフを発見してPR提案
  4. コード実行はCounter社のVercelサンドボックス内で完了、Anthropicインフラには流れない

「このエージェントはプロアクティブだ。勝者を決めてクリーンアップするだけでなく、次の機会を提案し、『始めましょうか?』と聞いてくる」とAngelaは強調した。

Part 3: Claude Code — 新しい開発の形

Kat(Claude CodeプロダクトマネージャーのKat Perez)が登壇し、「Claude Codeの存在理由」を改めて定義した。

「私たちのミッションは、すべての開発者が優れたアイデアを持ってから出荷するまでのギャップを閉じること。モデルのフロンティア知性を引き出すツールを作り、それをすべての開発者が使えるようにする。」

そして重要な比喩を使った。「私たちはロードマップを持つ製品チームではない。誰も地図を持っていない山岳地帯を一緒に登る登山家だ。」

開発の変化:1年前と今

Katが印象的に語ったのは、わずか1年でのワークフローの変化だ。

  • 1年前: Claudeが試みるすべての編集を逐一読み、パーミッションプロンプトごとに確認。何をすべきか・すべきでないかを細かく指示
  • : オートモードで走らせ、テスト・検証済みのPRが上がるまで確認不要

Claude Codeの4つのインターフェース

[CLI / Terminal]          ─── パワーユーザー向け。最小限のテキストUI
[IDE Extension]           ─── コード変更をリアルタイムで追える
[Desktop App]             ─── フルスクリーン。複数セッション管理・プレビュー
[Agents View (CLI)]       ─── ターミナル好きのためのマルチエージェント管理

Desktop Appの特徴:

  • 複数のClaude Codeセッションを一覧表示(実行中・入力待ち・完了済み)
  • Built-in preview(Webページのレンダリング確認)
  • サイドバーコントロールパネル
  • ローカルセッションとクラウドセッションを統合表示

Agents View(新しいCLI機能):

Claude Code CLI Agents View。複数セッションの状態(Needs Input / Working / Completed)が一覧表示される
図: 新しいCLI Agents View。「2 awaiting input / 4 working / 2 completed」を一画面で把握。ターミナルから離れずにセッション管理ができる

ターミナルからGUIに移動せずに、複数エージェントの状態(待機中・実行中・完了)を一覧表示。インラインで返信してブロックを解除、セッションにジャンプ・アウト、すべて場所を失わずに実行できる。

ユーザーフィードバックから生まれた5つの機能

Katはコミュニティからのフィードバックを起点に構築した機能を5つ紹介した。

① Code Review(コードレビュー自動化)

「コードレビューに使う時間を減らしたい」という声に応えて開発。エージェントのチームがコードの変更と補助ファイル全体をトラバースしてクリティカルなバグを検出。Anthropic社内の全エンジニアリングチームを含む数千の企業が毎日使用している。

② Remote Control(外出先からの操作)

「外出中もコーディングしたい」という声に応えて開発。iOSとAndroid向けClaude Codeリモートコントロールを提供。「ノートPCを開いたまま歩き回る必要がない。公園に行って芝生に触れながらでも、タスクをこなせる」とKatはリアルに表現した。

③ CI Autofix(PR自動メンテナンス)

「PRのバブシッティングに時間を取られる」という声に応えて開発。開いたPRを自動で監視し:

  • CIの失敗 → 自動修正
  • コードレビューのコメント → 自動対応
  • セキュリティレビューのコメント → 自動対応
  • マージコンフリクト → 自動リベース

④ Routines(スケジュール・Webhook・APIトリガー)

「Claude Codeで新チケットや新バグレポートを自動処理したい」という声に応えて開発。これが本講演で最も重要な新機能の一つだ。

⑤ Claude Security(セキュリティスキャン)

「大量のコードで、セキュリティチームが追いつかない」という声に応えて開発。
毎晩コードベースをスキャンし、深刻度別に脆弱性をランク付けし、Claude Codeでそれぞれに対処できる。

Mercado Libre: 500K PRs reviewed by agents with human oversight
図: Mercado Libre社の数字。23,000人のエンジニア組織で人間の監督付き50万件のPRをエージェントがレビュー

大規模採用事例

Shopify: 数百万のマーチャントを支えるeコマースプラットフォーム。Claude Codeを全社採用——エンジニアリングオルグだけでなく、PM・デザイナー・データサイエンティストも使用。さらにShopify自身のプラットフォームにClaude Codeを組み込んでツールを提供。「スピードがクレイジーで、社内ツールの作り方が変わった」(Director of Applied AI, Andrew McNamara)。

Mercado Libre: ラテンアメリカ最大のeコマース、1億人以上のバイヤー。23,000人のエンジニア組織でClaude Codeを全面採用。

  • 500,000件以上のPRを人間の監督付きでエージェントがレビュー
  • 9,000以上のアプリをモダナイズ
  • Q3 2026中に「完全エージェント主導のPRループで90%の自律コーディング」を目指す
  • 「最も心動かされる数字は件数ではない——何年もレビューとロードマップ会議だけをしていたマネージャーやVPたちが、また自分でコードを出荷し始めたことだ」(Kat)

Routines — 「Claudeがプロンプトを書く高階関数」

Routinesはすべての変化の中で最も重要な概念転換かもしれない。

Boris Chernvy はデモで解説した。

「私のコードの多くは、今はRoutinesで書かれている。自分でプロンプトを書いているのではなく、プロンプトを書くRoutineを作っている。エンジニアにわかりやすく言えば、高階関数みたいなものだ。Routinesは高階プロンプトだ。」

# .claude/routines/ci-autofix.yaml
name: "CI Autofix"
description: "PRが開かれたら自動でCIを監視・修正する"

trigger:
  webhook:
    event: "pull_request.opened"
    
schedule:
  # またはスケジュールでも起動可能
  cron: "*/30 * * * *"  # 30分ごと

execution:
  environment: "remote"  # ローカルまたはリモートクラウドで実行
  
prompt: |
  PRを監視してください。
  - CI失敗があれば根本原因を診断して修正
  - 単純なリトライではなく根本原因を直すこと
  - コードレビューコメントがあれば対応
  - マージコンフリクトがあればリベース
  
  PRがグリーンになるまで繰り返してください。

Routinesは以下の方法で起動できる:

  • スケジュール: cron式で定期実行
  • Webhook: GitHub/Slack等のイベントで起動
  • API call: 任意のAPIコールで起動

実行環境: ローカルマシン or リモートクラウドコンピュート

Acme PayのGitHub PR画面。Claude CodeがRefund機能のPRを作成
図: デモのAcme Pay(架空の決済会社)。Claude CodeがRefund機能の完全な実装を含むPRを自律的に作成

デモ: 1つのPRが多数のエージェントを統括する世界

Boris Chernvy がデモを担当した。

シナリオ: 架空の決済インフラ企業Acme Payの開発者として、マーチャントダッシュボードに返金機能を追加する。

Claudeが自律的に行ったこと:

  1. 返金フロー全体の実装(フロントエンド・バックエンド)
  2. 冪等性の実装(重複Webhookによる二重返金防止)
  3. マルチカレンシー対応(Acmeが展開している全リージョン)
  4. コンプライアンスチームのための監査ログ
  5. ブラウザでマーチャントダッシュボードを開き、返金をトリガー
  6. モーダルがsuccess toastの前に閉じるエッジケースを自分で発見
  7. レースコンディション(楽観的更新のタイミング)と特定
  8. 修正してブラウザで再確認、問題なしを確認してからタスク完了

「これがポイントだ。Claudeが自分の仕事を検証できるなら、あなたは別の作業をしながら動かしておいて、完全に動く結果が来るまで待てる。」

次のシーンでBorisはDesktop Appを開き、複数のセッションが並行して動いている様子を見せた。

  • dark-mode: システムテーマを明示的なトグルに変更 — どの機能を優先する?(入力待ち)
  • release-notes: ドラフト完成 — どの機能を使う?(入力待ち)
  • pr-review: 認証サーフェスの変更に関して6件のオープンPRをスキャン中(実行中)
  • perf-audit: events.org.tsのインデックスライブ — 約5000行(実行中)
  • payment-migration: 新プロセッサーへの課金移行 — 11/14完了(実行中)
  • onboarding-copy: 5画面の空状態のコピーを書き直し中(実行中)

「同期的なコーディングは、今起きていることの一部に過ぎない。」

そしてCI Autofixのデモ。最後のセッションが開いたPRを監視し始め——CIがネットワークタイムアウトで失敗——Routineが起動し、既知のインフラ問題と診断、ジョブを再試行ではなく根本原因を修正してグリーンに。「このPRのオーナーは赤いXを見ることすらない。」

全体像: 3層が語る1つのストーリー

基調講演の最後にBorisは3つのパートを統合した。

キャパビリティはすでにここにある。残るギャップは、それをどれだけ速く仕事に変換するか。

  • Lisa(モデル層)の能力曲線: 指数的に伸びるモデル知性
  • Angela・Caitlyn(プラットフォーム層): 自分たちがコントロールするインフラ上で動くエージェント
  • Kat・Boris(Claude Code層): 開発者が毎日の仕事で使うツール

Borisは「探索を続けよう」と締めくくった。モデル評価をしているなら研究トーク、ユーザー向けに構築しているならCloudプラットフォームセッション、日常の開発ワークフローに取り込みたいならClaude Codeワークショップ——「飛び込んで、深掘りして、一緒に作り始めよう」。

開発者が今週できること

基調講演の内容を踏まえて、今すぐ実装・実験できるものをまとめる。

アクション 対象 所要時間
Routinesを1つ設定(CIオートフィックスから始める) Claude Codeユーザー 30分
Advisor戦略をMessges APIで試す(Sonnet executor + Opus advisor) API開発者 1時間
Claude Managed AgentsでMCP Tunnelを設定 Enterprise開発者 半日
Self-hosted Sandboxをプロバイダー1社で試す Platform開発者 半日
Desktop AppのAgents Viewでマルチセッション管理を試す Claude Codeユーザー 15分
Evalセットを1つ更新して次のモデルに備える チームリーダー 1日

まとめ

「Code with Claude London 2026」は、モデルの指数的成長と現実の線形採用のギャップを埋めるための具体的なインフラをAnthropicが用意したことを示した発表だった。

  • Advisor戦略: フロンティアモデル品質を1/5のコストで実現する新しいAPI設計
  • Self-hosted Sandbox + MCP Tunnels: 企業のコードも、内部サービスも、パブリックインフラに出さずにエージェントを動かせる
  • Routines: 「開発者がプロンプトを書く」から「Claudeがプロンプトを書く」へのパラダイム転換
  • CI Autofix: PRが自分でグリーンになる。オーナーは赤いXを見ない

Boris Chernvyが最後に言った言葉が印象的だ。「デフォルトはもう『Claudeに指示を出す』ではない。デフォルトは『ClaudeにClaude Codeを動かさせる』だ。」

タスクホライゾンが分単位から時間単位へ、そして継続稼働へと伸びる中で、先に準備した開発者が次のジャンプの恩恵を最初に受ける。

参照ソース