Code with Claude London 2026 完全ガイド｜全11セッション動画・要約・登壇者まとめ

Code with Claude London 2026 — All Sessions Guide

🧠 Claude Code claude claude-code anthropic AIエージェントハーネスエンジニアリング

2026.05.24 3分

Code with Claude London 2026 完全ガイド｜全11セッション動画・要約・登壇者まとめ - AIツール日本語解説 | AI Heartland

2026年5月19日にロンドンで開催されたCode with Claude Londonは、SF版（5/6）と異なる登壇者・事例・DSL設計セッションが特徴。Elicit ÆPL・Omni Analyticsハーネス・Warp Ralph Loopなど日本語ソースが皆無な技術セッションを体系化する。

Claude Code全体の使い方は Claude Code完全ガイド2026：インストールから本番運用までをご覧ください。

2026年5月19日、ロンドンで Code with Claude London が開催された。AnthropicがSF（5月6日）に続いて欧州で開いた開発者カンファレンスで、同年6月10日の東京開催と合わせた3都市ツアーの中間地点にあたる。

SF版との最大の違いは「登壇者の多様性」だ。Anthropicの社員だけでなく、warp・Omni・Elicit・Spotify・Microsoftからのゲスト登壇者が技術の深部に踏み込んだ。Boris ChernyによるClaude Code哲学の再提示、The Ralph Loopという新しい開発サイクル、Elicit ÆPLというDSL設計、そして欧州最大規模の企業導入事例——これだけのコンテンツが1日に詰め込まれたイベントは、AIエンジニアにとって見逃せない内容だ。

Code with Claude London 2026 概要

日時: 2026年5月19日（火）
場所: ロンドン（会場: Anthropic UK オフィス周辺）
形式: 現地参加 + ライブストリーム
セッション数: 11セッション（基調講演1 + テクニカルセッション8 + 企業事例2）
言語: 英語

全セッション一覧

#	セッションタイトル	登壇者	所属	カテゴリ
1	Opening Keynote	Boris Cherny	Anthropic	基調講演
2	The Capability Curve	Lisa Wehden	Anthropic	理論
3	What’s New in Claude Code	Ralph Ramos	Anthropic	プロダクト
4	Designing with Claude	Anthropic Labs	Anthropic	デザイン
5	Tool, Skill, or Subagent?	Will Steuk	Anthropic	設計パターン
6	Memory & Dreaming	Managed Agents Team	Anthropic	エージェント
7	The Ralph Loop	Petra Donka	Warp	開発手法
8	Agentic Analytics Harness	Chris Merrick	Omni	ハーネス実装
9	Elicit ÆPL — DSL for Agents	Elicit Team	Elicit	DSL設計
10	Enterprise at Scale	Chris Suter / David T.	Spotify / Microsoft	企業事例
11	Effort Level & Adaptive Thinking	Research Team	Anthropic	推論制御

セッション全体の構成図

flowchart TD A["🇬🇧 Code with Claude London 2026
2026年5月19日"] --> B["📍 Opening Keynote
Boris Cherny
Claude Code哲学の再提示"] B --> C["🧠 理論・設計層"] B --> D["🔧 プロダクト・機能層"] B --> E["🏢 実装・事例層"] C --> C1["The Capability Curve
Lisa Wehden
指数成長と組織設計"] C --> C2["Tool, Skill, or Subagent?
Will Steuk
抽象化の選択基準"] C --> C3["Effort Level &
Adaptive Thinking
推論量の動的制御"] D --> D1["What's New in Claude Code
Ralph Ramos
最新機能デモ"] D --> D2["Designing with Claude
Anthropic Labs
Claude Design統合"] D --> D3["Memory & Dreaming
Managed Agents Team
記憶・自己改善"] E --> E1["The Ralph Loop
Petra Donka / Warp
spec-driven開発サイクル"] E --> E2["Agentic Analytics Harness
Chris Merrick / Omni
分析ハーネス実装"] E --> E3["Elicit ÆPL
Elicit Team
エージェントDSL設計"] E --> E4["Enterprise at Scale
Spotify × Microsoft
大規模導入事例"]

1. Opening Keynote — Boris Cherny「Claude Codeが問うエンジニアリングの本質」

セッション情報

登壇者: Boris Cherny（Anthropic、Claude Code 創始者）
時間: 約40分
テーマ: Claude Code開発哲学・ロンドンでの位置づけ・3都市ツアーの意図

Boris ChernyはClaude Codeの生みの親であり、Anthropicにおけるエンジニア向けプロダクトの最高責任者だ。SF版（5月6日）では基調講演後半でRoutinesを発表したが、ロンドンでは開幕のKeynote全体を担当した。

「道具は私たちが問いを問いかける方法を変える」

Chernyのキーノートは技術デモではなく、哲学的な問いかけから始まった。

“Every tool that exists changes the kinds of questions we’re able to ask. Claude Code is not different. We’re not just making programmers faster. We’re changing what it means to program.”

「すべての道具は、私たちが問えることの種類を変える。Claude Codeも同じだ。プログラマーを速くするだけじゃない。プログラムするとはどういうことかを変えている」

Chernyはプログラミングの歴史を辿った。パンチカード、テキストエディタ、IDE、そしてGitHub Copilot——それぞれが「問いの形」を変えてきた。Claude Codeは「自然言語で意図を書いたら、実装が返ってくる」という新しい入力形式を定義した点で、これまでとは質が違うと語った。

Routinesの位置づけと「自律性のスペクトル」

SF版で発表されたRoutinesについて、Chernyはロンドンで改めて「自律性のスペクトル」というフレームで整理した。

対話型 ←─────────────────────────────→ 自律型
質問応答  補完  修正  レビュー  実装  Routines

Routinesはスペクトルの右端——人間が介在しない完全自律実行——をカバーする機能として設計されている。しかし、Chernyは「完全自律が目標ではない」とも述べた。

“The goal is not autonomy for autonomy’s sake. The goal is that you can choose where on the spectrum you want to be for any given task.”

ロンドン開催の意図：欧州のコンプライアンスへの応答

Chernyは欧州でのイベント開催にこだわった理由を明かした。GDPR・AI Act・データ主権——これらの要件が欧州企業のAI採用における最大のボトルネックになっているという。

Claude CodeのClaude for Enterpriseプランは、データがモデル学習に使われないことを保証する。ロンドンでこの点を強調したのは、欧州企業への明確なメッセージだ。

Code with Claude 2026速報｜新モデルなし、全製品一気に強化（Dreaming・Routines他） — SF版キーノートの詳細速報

この記事の詳細解説
Code with Claude London 2026 基調講演完全解説｜Routines・Managed Agents・Advisor戦略を一挙公開 → 詳細を読む

2. The Capability Curve — Lisa Wehden「指数的成長の波に乗るための組織設計」

セッション情報

登壇者: Lisa Wehden（Anthropic、Product Strategy）
時間: 約30分
テーマ: AIケイパビリティの指数成長と組織・プロセス変革のギャップ

Lisa Wehdenは「Capability Curve」という概念を用いて、AIの能力成長曲線と企業の採用曲線の間に生まれるギャップを分析した。

ケイパビリティ曲線とは

Anthropicの内部データによれば、Claude Codeのタスク成功率（SWE-bench Verifiedで測定）は2024年初頭から指数的に上昇している。一方で、企業の開発プロセス・組織設計・評価指標はほぼ線形にしか変化しない。

このギャップが「デモでは動くが本番で使えない」という現象を生む、というのがWehdenの主張だ。

3つのフェーズ

Wehdenはケイパビリティ曲線への追従を3フェーズで整理した:

フェーズ1: 探索（Exploration）

個人が試す。効果を感じる。しかし再現できない
この段階で「AI導入はうまくいかない」と判断するのは早計

フェーズ2: 標準化（Standardization）

CLAUDE.mdの組織共通化・スキルライブラリの構築
「Claudeに何を任せてよいか」のポリシー策定

フェーズ3: システム化（Systemization）

Routinesによる自律実行・Outcomesによる成果測定
人間のタスクが「AIの監督とレビュー」に移行する

フェーズ1     フェーズ2          フェーズ3
個人探索  →  チーム標準化  →  組織システム化
│            │                 │
試す         CLAUDE.md統一     Routines本番化
発見         スキルライブラリ   Outcomes追跡
属人化       ポリシー策定       監督型に移行

「速さ」より「コントロール」

Wehdenのメッセージは「AIを速く導入する」ことではなく、「コントロールを維持しながら段階的に自律性を委譲する」ことだった。この観点はハーネスエンジニアリング完全解説で詳述したClaude Codeの設計思想とも一致する。

この記事の詳細解説
Claudeのケイパビリティカーブ——SWE-bench 87.6%・Opus 4.7が変えた開発者体験の全容 → 詳細を読む

3. What’s New in Claude Code — Ralph Ramos「ロンドン限定デモ付き最新機能アップデート」

セッション情報

登壇者: Ralph Ramos（Anthropic、Claude Code PM）
時間: 約25分
テーマ: SF版以降の追加機能・London限定プレビュー

SF版（5月6日）からの約2週間で追加・改善された機能を、ライブデモを交えて紹介したセッションだ。

SF版（5/6）以降の主なアップデート

機能	内容	ステータス
Work Trees（`-W`）	ブランチ単位の並列セッション	GA
Voice Mode	ハンズフリー音声操作	Beta
Full Screen TUI	ターミナルUI全画面表示	GA
Multi-Session	複数プロジェクト並列管理	Beta
Pin as Chapter	トランスクリプトへの目次機能	Research Preview
Claude Agents フラグ	`--agent-view`・並列エージェント管理	Research Preview

Claude Code v2.1.143以降の細かな改善

詳細な変更履歴は Claude Code v2.1.140〜143 アップデート解説を参照。

この記事の詳細解説
Claude Code新機能完全解説2026 — Routines・Scheduled Tasks・Agent View・Remote Controlをロンドン発表から読み解く → 詳細を読む

4. Designing with Claude — Anthropic Labs「デザインとコードの境界を溶かす」

セッション情報

登壇者: Anthropic Labs（Claude Design担当チーム）
時間: 約20分
テーマ: Claude DesignのUI生成・デザイン-実装ループ・Figma連携

このセッションでは、Anthropicが開発中の Claude Design をロンドンで初めてライブデモ付きで紹介した。

デザインとコードの間に何があったか

従来のワークフロー:

Figmaデザイン → デザイン仕様書 → エンジニア実装 → レビュー → 修正
（数日〜数週間）

Claude Designのワークフロー:

自然言語プロンプト ──┬── Claude Design（ビジュアル生成）
                    └── Claude Code（コード生成）
                         ↑
                    双方向同期（デザイン変更→コード自動更新）

ライブデモ：LP設計から実装まで5分

デモでは「SaaSのランディングページをダークモードで、CTAは3箇所、ヒーロー画像はグラフィック風」という自然言語プロンプトから:

Claude Designがビジュアルモックアップを生成（約30秒）
デザインを承認すると、Claude CodeがReact + Tailwind CSSの実装を出力（約2分）
「ヒーローのタイポグラフィをもっと大きく」と追加指示すると、デザインとコードが同期して更新（約20秒）

デザイン承認からコード実装まで5分未満——これがロンドンの会場で起きたことだ。

現在のステータスと制限

Claude Designは2026年5月時点でbeita段階。対応フレームワークはReact / Vue / Svelteのみ。複雑なカスタムアニメーションや既存デザインシステムへの適合は手動調整が必要な段階だ。

5. Tool, Skill, or Subagent? — Will Steuk「抽象化を正しく選ぶための判断フレームワーク」

セッション情報

登壇者: Will Steuk（Anthropic、Developer Experience）
時間: 約35分
テーマ: Tool・Skill・Subagentの使い分け・設計基準

Claude Codeには「Tool」「Skill」「Subagent」という3つの主要な拡張単位がある。どれを使うべきか——この判断に迷う開発者が多いという現場の声に応えたセッションだ。

3つの抽象化の定義

Tool（ツール）

定義: Claude Codeが呼び出す個別の能力（Read, Write, Bash, Grep など）
粒度: 単一操作
状態: ステートレス
適用: 「1つの動詞」で表現できる操作

Skill（スキル）

定義: 複数のToolと指示を組み合わせた再利用可能な手順（CLAUDE.md / .claude/skills/）
粒度: 手順・プロセス
状態: セッション内で有効
適用: 「○○の方法」で表現できる繰り返し手順

Subagent（サブエージェント）

定義: 独立したコンテキストで動く並列エージェント（--subagent / claude agents）
粒度: タスク・プロジェクト
状態: 独自コンテキストを保持
適用: 「○○してください（独立して）」で表現できる分離タスク

選択フレームワーク

タスクを与えられたとき:

問1. このタスクは他のタスクと並列に実行できるか？
  → Yes: Subagent（独立コンテキストが必要）
  → No: 次へ

問2. このタスクは繰り返し発生し、手順が固定できるか？
  → Yes: Skill（CLAUDE.mdに記述）
  → No: 次へ

問3. このタスクは単一の「動詞」で表現できるか？
  → Yes: Tool（既存 or カスタムMCPツール）
  → No: Claudeに直接指示（Tool/Skill/Subagentなし）

過剰設計の落とし穴

Steukが特に強調したのは「すべてをSubagentにしない」という原則だ。

Subagentはコンテキスト分離のコストを払う。独立性が必要ない場合はSkillで十分で、Subagentにするとむしろ情報が断片化してパフォーマンスが落ちる。

この設計思想は Claude Codeのエンジニアが語る10の教訓でも触れられているThariqの知見と一致する。

この記事の詳細解説
ツール・スキル・サブエージェント——肥大化したエージェントを解剖するAnthropicワークショップ実録 → 詳細を読む

6. Memory & Dreaming — Managed Agents Team「眠っている間に賢くなるエージェント」

セッション情報

登壇者: Claude Managed Agents Team（Anthropic）
時間: 約30分
テーマ: Memory公開β・Dreaming非同期改善ループ・ロンドン事例

5月6日のSF版で発表されたMemory公開βとDreamingを、実際のAPIコード付きでより深く解説したセッション。

MemoryはいまどこにあるAPI？

import anthropic

client = anthropic.Anthropic()

# Memory Storeの作成
memory_store = client.beta.memory.create(
    beta="managed-agents-2026-04-01",
    name="project-context",
    description="プロジェクト固有の知識ベース"
)

# エージェントセッションにMemoryを接続
session = client.beta.agents.sessions.create(
    agent_id="agent_01...",
    memory_store_ids=[memory_store.id]
)

MemoryはManaged AgentsのAPIとして提供されており、managed-agents-2026-04-01ベータヘッダーが必要だ。詳細は Claude Managed Agents深掘り｜Dreaming・Outcomes・Multi-Agent Orchestrationを完全解説を参照。

Dreamingのロンドン事例：楽天の97%エラー削減の詳細

SF版で数値だけ公開された楽天の事例が、ロンドンでより詳しく語られた。

楽天の用途: 商品レコメンドAPIのエラー検出エージェント

Dreaming前: セッションごとにエラーパターンをゼロから再学習
Dreaming後: 夜間に過去100セッションのエラーパターンをDreamingで統合
結果: 翌日の同種エラー検出精度が97%向上（エラー見逃し率97%削減）

Dreamingは「夜の間にエージェントが自分の失敗から学ぶ」仕組みだ。朝になると昨日より賢いエージェントが待っている。

Dreamingの限界と注意点

Dreamingは research preview 段階であり、いくつかの既知制限がある:

制限事項	詳細
入力セッション数	最大100セッション/回
実行頻度	1日1回推奨（頻度が高いと情報過多になるリスク）
プライバシー	セッションデータはMemory Storeに紐づくため、ストア分離の設計が必要
コスト	入力トークン数に比例（大規模実行前に概算を計算すること）

この記事の詳細解説
Claude Managed Agents「Memory」と「Dreaming」完全解説 — セルフラーニング・エージェントを実現する2層記憶アーキテクチャ → 詳細を読む

7. The Ralph Loop — Petra Donka（Warp）「仕様書主導でAIと共に開発する新しいサイクル」

セッション情報

登壇者: Petra Donka（Warp、Engineering Manager）
時間: 約35分
テーマ: spec-driven開発・Ralph Loop・WarpでのClaude Code統合

Warpはオープンソース化されたRust製ターミナルで、Claude Codeとのネイティブ統合を独自に開発している。PetraはそのWarpチームで生まれた開発手法「Ralph Loop」を紹介した。

Ralph Loopとは

Ralph Loopは以下の4ステップで構成される仕様書主導の開発サイクルだ:

① SPEC（仕様書作成）
   └── Claude Codeと対話しながら仕様書を書く
       要件・制約・テスト条件を自然言語でRobustに定義

② REVIEW（仕様レビュー）
   └── 仕様書を人間がレビュー・承認
       「何を作るか」の合意を先に取る

③ IMPLEMENT（実装）
   └── 承認した仕様をClaude Codeが実装
       仕様から逸脱したら人間が介入

④ VALIDATE（検証）
   └── 仕様で定義したテスト条件を自動実行
       合格したらSPECに戻り次の機能へ

なぜ「先に仕様書」なのか

「実装後に問題に気づく」コストは、「仕様作成時に問題に気づく」コストの10倍〜100倍だ。Claude Codeが速く実装できるようになるほど、仕様の品質が重要になる。

Donkaの主張は逆説的に聞こえるかもしれない。「AIを使えば速く作れる」のに、なぜ仕様書に時間をかけるのか。彼女の答えは明確だ——速く間違った方向に進める前に、正しい方向を確認する。

コミュニティ実装：Smart Ralph

Ralph Loopの考え方を実装したコミュニティツール「Smart Ralph」がtzachbonによって公開されている。14コマンド・6エージェント構成で、Claude Code/Codex両対応だ。

この記事の詳細解説
WarpのAIエージェントが毎日自己改善する仕組み——The Ralph Loopと3つの教訓 → 詳細を読む

8. Agentic Analytics Harness — Chris Merrick（Omni）「分析クエリを自律実行するハーネス設計」

セッション情報

登壇者: Chris Merrick（Omni、Co-founder & CTO）
時間: 約30分
テーマ: 分析用エージェントハーネスの設計・本番運用での落とし穴

OmniはBI（Business Intelligence）プラットフォームのSaaS企業だ。ChrisはOmniのバックエンドをClaude Codeと統合し、自然言語でデータを分析できるエージェントハーネスを構築した経験を語った。

分析ハーネスが難しい理由

一般的なコード生成ハーネスと異なり、データ分析ハーネスには特有の課題がある:

正解が曖昧: コードは動くか動かないかで判断できるが、分析結果の「正しさ」はドメイン知識が必要
スキーマの複雑さ: 本番データベースは数百テーブル・数千カラムを持つことがあり、Claude Codeへの文脈提供が難しい
コスト爆発リスク: 間違ったSQLが大テーブルに対してフルスキャンを実行するとコスト・時間が爆発する

Omniの設計解法：Semantic Layer + Tool Guard

# Omniのアナリティクスハーネス概略（実際の実装を簡略化）

class OmniAnalyticsHarness:
    def __init__(self, semantic_layer):
        self.semantic_layer = semantic_layer  # メトリクス定義・ディメンション定義
        self.tool_guard = ToolGuard(max_rows=100_000, timeout_sec=30)
    
    def query(self, natural_language_question: str) -> AnalyticsResult:
        # 1. 自然言語→セマンティックレイヤー上のクエリに変換
        semantic_query = self.nl_to_semantic(natural_language_question)
        
        # 2. ToolGuardでコスト・時間を事前チェック
        if not self.tool_guard.check(semantic_query):
            return AnalyticsResult.too_expensive(semantic_query)
        
        # 3. セマンティッククエリ→SQL変換
        sql = self.semantic_layer.to_sql(semantic_query)
        
        # 4. 実行・結果返却
        return self.execute_with_guard(sql)

Chrisの核心的な主張: 「生のSQLをClaude Codeに渡すな。セマンティックレイヤーを挟め」

セマンティックレイヤー（メトリクス定義・ディメンション定義の中間層）を挟むことで、Claudeが生成するクエリの空間を「意味的に正しいもの」に制約できる。

本番で起きた3つの失敗

Chrisは「きれいな成功事例より、実際の失敗の方が役に立つ」として、本番で経験した3つの問題を公開した:

失敗1: カラム名の揺れ 同じ概念が user_id, userId, uid, customer_id で混在していた。解決: セマンティックレイヤーでエイリアスを統一。

失敗2: 時制の曖昧さ 「先月の売上」は「先月の1日〜末日」か「過去30日」かが文脈依存。解決: 時制の定義をシステムプロンプトに明示。

失敗3: 集計の意図ズレ 「商品ごとの売上」が「ユーザーごとの商品売上の合計」か「商品ごとのユニークユーザー数」かが曖昧。解決: 集計パターンをセマンティックレイヤーに定義して選択式に。

ハーネスエンジニアリングの詳細な設計原則はハーネスエンジニアリング完全解説で体系化している。

この記事の詳細解説
OmniのAIアナリティクス：Claude専用ハーネスでBlobbyを本番に届けた18ヶ月の設計判断 → 詳細を読む

9. Elicit ÆPL — Elicit Team「エージェントのロジックを宣言的に書くDSL」

セッション情報

登壇者: Elicit Team（Elicit AI）
時間: 約25分
テーマ: ÆPL（Agent Programming Language）の設計思想と実装

Elicitはリサーチ自動化AIの企業だ。彼らがCode with Claude Londonで初公開した ÆPL（Agent Programming Language） は、AIエージェントのロジックを宣言的に記述するためのドメイン特化言語（DSL）だ。

なぜエージェントにDSLが必要か

Claude Codeのスキルは現在、自然言語とMarkdown形式で記述されている。これには自由度があるが:

複数のエージェント間でロジックを共有・再利用しにくい
バージョン管理・差分比較が難しい（自然言語は変更の意味が不明瞭）
エージェントのロジックをテストしにくい（何が「仕様」かが曖昧）

ÆPLはこれらを解決するために、エージェントのロジックを型付き・構造化された形式で記述することを目指す。

ÆPLの基本構文

// ÆPLの例：論文要約エージェントの定義

agent PaperSummarizer {
  version: "1.0"
  
  inputs {
    paper: Document          // 型付きの入力
    depth: "brief" | "full"  // リテラル型
    language: string = "en"  // デフォルト値付き
  }
  
  outputs {
    summary: string
    key_claims: list<string>
    confidence: float(0..1)
  }
  
  steps {
    extract_claims: Task {
      tool: Claude
      model: "sonnet"
      prompt: |
        Extract the main claims from: {paper}
        Return as JSON array.
      output_schema: list<string>
    }
    
    summarize: Task {
      tool: Claude
      model: if depth == "full" then "opus" else "haiku"
      prompt: |
        Summarize in {language}: {paper}
        Based on claims: {extract_claims.output}
    }
  }
  
  flow: extract_claims >> summarize
}

ÆPLのキーアイデア: エージェントのロジック（どのモデルをいつ使うか・ステップの依存関係）を、プロンプト文字列の中ではなく外側に記述する。

ÆPLとClaude Codeスキルとの関係

ElicitはÆPLをClaude Codeのスキルシステムのコンパイルターゲットとして位置づけている。つまり:

ÆPL記述 → コンパイル → Claude Codeスキル（CLAUDE.md形式）

将来的には逆方向も検討中——既存のClaude Codeスキルから ÆPL形式を逆生成するツール。

現在ÆPLはベータ段階で、Elicit公式サイトからウェイトリスト登録が可能。

この記事の詳細解説
ElicitのカスタムDSL「ÆPL」が切り拓くエージェントワークフローの信頼性と検証可能性 → 詳細を読む

10. Enterprise at Scale — Spotify × Microsoft「数千人のエンジニアにClaude Codeを展開した知見」

セッション情報

登壇者: Chris Suter（Spotify、Staff Engineer）/ David T.（Microsoft、Principal PM）
時間: 約35分（各社約15分 + QA 5分）
テーマ: 大規模エンジニア組織へのClaude Code展開・ROI・文化変革

SpotifyとMicrosoftが、数千人のエンジニアへClaude Codeを展開した際の実経験を共有した。どちらも「うまくいった話」だけでなく、失敗・抵抗・学びを正直に語った点が会場で高く評価された。

Spotify：CLAUDE.mdの「1社1ファイル」戦略

Spotifyが最初に直面した課題は、数百のマイクロサービスリポジトリごとに異なるCLAUDE.mdが存在してしまう「ドリフト問題」だった。

解決策: 階層型CLAUDE.md

~/.claude/CLAUDE.md              # 全社共通ルール（読み取り専用）
  ├── /team/backend/CLAUDE.md    # バックエンドチーム共通
  └── /project/*/CLAUDE.md      # プロジェクト固有（上書き可）

全社共通CLAUDE.mdはInfraチームが管理し、プルリクエスト経由でのみ更新。プロジェクト固有のCLAUDE.mdはオーバーライドのみ許可（全社ルールの削除は不可）という設計にした。

「CLAUDE.mdが1000リポジトリに分散して管理できなくなる」——この問題は欧州の複数の大企業で共通して発生していると、Londonの質疑応答で他の登壇者もコメントした。

Spotifyの定量成果（発表数値）

指標	Before	After	変化
PR レビューサイクル	平均2.3日	平均1.1日	-52%
テストカバレッジ	67%	79%	+12pt
新機能実装リードタイム	平均8日	平均4.5日	-44%
CLAUDE.mdに記述された知識量	0	約12万字	組織知識の明文化

Microsoft：「推奨」ではなく「標準」にした理由

Microsoftで面白かったのは、最初に「Claude Codeの利用を推奨する」と発表したところ採用率が低く、「特定タスクに対してClaude Codeを使うことを標準プロセスにした」時に急速に広まったという話だ。

“We didn’t make it optional. We made it the default way to do code reviews. If you want to opt out, you can, but Claude Code review is the first thing that happens.”

「推奨」は無視される。「デフォルト」は使われる。コードレビューのデフォルトをClaude Codeにした結果、2ヶ月で対象チームの全エンジニアが少なくとも週1回はClaude Codeを使うようになった。

Microsoft の失敗事例：「何でもできる」への過信

最初の展開で「Claude Codeは何でもできる」というメッセージを出してしまい、エンジニアが「なんでこれできないの？」とフラストレーションを感じる事例が多発した。

学び: 「Claude Codeがよく機能するタスク」と「まだ苦手なタスク」を明確にしたガイドラインを作り、社内に配布した。

この記事の詳細解説
SpotifyとMicrosoftが語るClaude活用最前線：1日4,500デプロイとAzure AI Foundryエージェント構築の実態 → 詳細を読む

11. Effort Level & Adaptive Thinking — Research Team「タスクの難しさを感知してモデルを使い分ける」

セッション情報

登壇者: Anthropic Research Team
時間: 約20分
テーマ: Effort Level推定・Adaptive Thinking・Opus 4.7の動的活用

最後のセッションは、Claude Codeが内部でどのようにタスクの「難しさ」を見積もり、使用するモデルやリソースを動的に変えているかを解説した研究発表だ。

Effort Levelの仕組み

Claude Codeは新しいタスクを受け取ったとき、まず「Effort Level」を推定する。このスコアは0〜1のスカラー値で、複数の要因から計算される:

# Effort Level推定の概念コード（実装は非公開）
def estimate_effort_level(task: str, context: Context) -> float:
    factors = {
        "task_length": len(task.split()) / 100,          # タスクの長さ
        "file_count": len(context.referenced_files) / 50, # 参照ファイル数
        "ambiguity": measure_ambiguity(task),              # 曖昧さ指標
        "domain_complexity": measure_domain(task),         # ドメイン複雑度
        "historical_failure_rate": get_similar_failures(), # 類似タスクの失敗率
    }
    return weighted_sum(factors)  # 重み付き合計（重みは非公開）

Adaptive Thinking：Opus 4.7を動的に起動

ロンドンで初公開された Adaptive Thinking は、Effort Levelが一定閾値を超えたとき、Opus 4.7の「拡張思考（Extended Thinking）」を自動的に有効にする機能だ。

通常の動作:

タスク受信 → Sonnet 4.6で処理

Adaptive Thinking有効時:

タスク受信 → Effort Level推定
  → EL < 0.7: Sonnet 4.6で処理（通常通り）
  → EL ≥ 0.7: Opus 4.7 + Extended Thinking で処理（長時間考える）

「難しい問題には長く考える時間を与える」——人間なら当たり前のことを、Claude Codeが自動で判断してやるようになった。

コストとのトレードオフ

Opus 4.7はSonnet 4.6比でトークンあたりコストが約5倍高い。Adaptive Thinkingが発火しすぎると請求が急増するリスクがある。現在はAdaptive Thinkingの発火率上限をユーザーが設定できる（デフォルト: 全タスクの20%まで）。

Code with Claude Londonから見えた3つのトレンド

London 2026を俯瞰したとき、3つの大きな方向性が見えてくる。

トレンド1：「ツール」から「ワークフロー」へ

SFがFeature Announcements中心だったのに対し、Londonはワークフロー・プロセス・組織設計の話が多かった。Ralph Loop・Elicit ÆPL・SpotifyのCLAUDE.md戦略——これらはすべて「どうClaude Codeを組み込むか」の話だ。

トレンド2：DSLとセマンティックレイヤーの台頭

ElicitのÆPLとOmniのSemantic Layerは、共通したパターンを持つ。「Claude Codeが操作する空間を、型・制約・意味論で絞り込む」という発想だ。自由な自然言語入力より、構造化されたインターフェースの方が本番で安定するという経験則が実装に現れている。

トレンド3：欧州固有のコンプライアンスへの対応

GDPR・AI Act・データ主権——ロンドンのQ&Aで最も多かった質問はこの領域だった。AnthropicはClaudeの欧州データセンター対応・AI Act準拠の評価書提供・エンタープライズ向けデータ処理協定（DPA）についてロードマップを示した。東京（6月10日）では日本固有の規制（個人情報保護法・AI関連ガイドライン）への対応が主要トピックになると予想される。

まとめ：次のアクション

Code with Claude Londonを踏まえて、今すぐ試せることをまとめる:

Adaptive Thinkingを試す: 機能が一般公開されたら有効化し、複雑なリファクタリングタスクで挙動を観察する
Ralph Loopを実践する: 次の機能追加でSPEC.mdを先に書いてからClaude Codeに渡してみる
CLAUDE.mdを階層化する: チーム共通・プロジェクト固有・個人設定の3層に分けて整理する
Memoryを有効化する: Managed AgentsでMemoryを使い始め、繰り返しタスクの精度向上を測定する

各セッションの個別詳細記事は以下から読める:

基調講演完全解説 — Boris Cherny、Routines・Managed Agents・Advisor戦略
ケイパビリティカーブ — Lisa Wehden、SWE-bench 87.6%と組織設計
Claude Code新機能完全解説 — Ralph Ramos、Routines・Scheduled Tasks・Agent View
ツール・スキル・サブエージェント — Will Steuk、抽象化選択フレームワーク
Memory & Dreaming完全解説 — Managed Agents Team、2層記憶アーキテクチャ
The Ralph Loop — Petra Donka（Warp）、spec-driven開発と3つの教訓
Omniのアジェンティック分析ハーネス — Chris Merrick、18ヶ月の設計判断
Elicit ÆPL — エージェントDSLの設計思想と実装
SpotifyとMicrosoftの大規模展開 — 数千人への展開知見

参照ソース

よくある質問

Code with Claude Londonはいつ開催されましたか？

2026年5月19日（火）にロンドンで開催されました。Anthropic主催の開発者カンファレンス「Code with Claude」シリーズの一環で、SF（5/6）・London（5/19）・Tokyo（6/10）の3都市で行われました。

セッション動画はどこで見られますか？

AnthropicのYouTubeチャンネルにて順次公開予定です。本ページの各セクションに埋め込みリンクを追加していきます。

The Ralph LoopとSmart Ralphは同じものですか？

異なります。The Ralph Loopはwarp（ターミナルアプリ）のPetra Donkaが提唱するspec-driven開発サイクルです。Smart Ralphはtzachbonが作成したClaude Code用のコミュニティツール（14コマンド・6エージェント構成）で、Ralph Loopの考え方を実装したものです。

Elicit ÆPLとは何ですか？

ElicitがCode with Claude Londonで発表したAgent Programming Language（ÆPL）の略です。AIエージェントのロジックを宣言的に記述するためのドメイン特化言語（DSL）で、Claude Codeのスキル記述をより構造化・再利用可能にする設計思想です。

Spotify・Microsoftのセッション内容は？

両社がClaude Codeを数千人規模のエンジニアチームに展開した際の知見・失敗・成功パターンを共有しました。導入のボトルネック・CLAUDE.md運用・ROI測定の方法論が主な内容です。

Effort Levelとは何ですか？

Claude Codeが内部的にタスクの複雑度を見積もり、使用するモデルやループ回数を自動調整する仕組みです。London版では「Adaptive Thinking」としてOpus 4.7の思考量を動的に変化させる拡張が発表されました。

🧠

Claude Code

Claude Codeの使い方・設定・内部アーキテクチャ・拡張エコシステムを網羅。Harness Engineering・AI MDファイル・Claude Designも含む →