2026年5月19〜20日、Anthropicが開催した「Code w/ Claude」カンファレンスで2本の講演が公開された。一本はSpotifyのChief Architectによる27分の発表、もう一本はMicrosoftのSenior Cloud Advocateによる34分のワークショップだ。どちらも非技術者向けのビジョン系ではなく、実装レベルの数字と具体的なアーキテクチャが開示されていた。
Spotify講演の衝撃は数字にある。2,800人のエンジニア組織で、99%以上がAI支援コーディングを使用。PR頻度は76%増加。その63%がAI支援で作成されている。1日4,500デプロイという生産性指標。そしてClaude(Opus 4.5リリース)を境に採用曲線が垂直に立ち上がった事実だ。
Microsoft講演は実装よりの内容だった。Azure AI Foundry上でClaude Sonnet 4.6を使ったエージェントを34分で構築するワークショップ。1,400以上のMCPツールと統合されたエンタープライズ基盤の実際の動かし方だ。
Claude Codeの全体アーキテクチャと本番運用の基礎は Claude Code完全ガイド2026:インストールから本番運用まで で解説している。
Spotifyの数字:99%採用率・PR頻度76%増・63%がAI支援の実態
Spotifyは現在、約2,800人のエンジニアを擁する大規模組織だ(スライド実測値。登壇者は「3,000人近く」と表現)。761百万人のユーザー(うち293百万人が有料サブスクライバー)を184市場でサービスしており、2,900以上のマイクロサービスが本番稼働している。コードベースの規模も巨大で、バックエンドは4,000万行のコードを持つモノリポに集約されており、さらに数千のポリリポが存在する。Claudeの採用は2025年後半に特に加速した。
採用率の推移:講演中に示されたグラフでは、Claude採用曲線(赤)が2025年11月のOpus 4.5リリースを境に急上昇した。それまでも社内ツールのロールアウトを定期的に行ってきたが、「AIコーディングツールほどの採用速度は一度も見たことがない」と担当者は語った。
現時点での数字は以下の通りだ。
- 99%超:AI支援コーディングを使うエンジニアの割合
- 94%:AIツールが生産性向上に貢献したと回答したエンジニアの割合(過去最高の自己評価スコアを記録)
- 76%増:AI導入後のPR頻度(しかも増加傾向は継続中。スライド作成中にも数字が更新されたと語られた)
- 63%:AI支援で作成されたPRの割合
- 4,500件/日:本番環境へのデプロイ数
- 1,000件超/月:エージェントが生成して本番にマージされるPR数
PR頻度の増加で注目すべきは、増加分の大半が「AIエージェントと開発者の協働によって作成されたPR」だという点だ。今や全PRの63%がAI支援で作成されており、人間だけが書くPRは少数派になりつつある。
Spotifyのデータは明確だ。それ以前のモデルでは「賢さが足りない」と感じていた。Opus 4.5リリース後、突然すべてが機能し始めた。モデル能力が実用閾値を越えた瞬間に採用曲線が変化するという「閾値効果」の典型例だ。
Fleet ShiftとHonk:毎月1,000件超の自動マージを支えるアーキテクチャ
Spotifyはここ数年、独自のコード自動化基盤を構築してきた。AI以前から始まった「Fleet Shift」と「Honk」という2つのシステムがその中核だ。
Fleet Shiftの役割
Fleet Shiftは、数千のリポジトリにまたがる変更を計画・スケジューリング・オーケストレーションするツールだ。UIはBackstageに統合されており、backstage.spotify.com/fleetshift でアクセスできる。具体的なユースケースは以下のようなものだ。
- JavaのバージョンアップグレードをN千コンポーネントに適用
- 特定のAPIを非推奨にして後継に移行
- セキュリティ脆弱性のパッチを全リポジトリに展開
- React クラスコンポーネントをフックに移行
Fleet Shift誕生の背景:数年前、Spotifyはある事実に気づいた。本番コードベースがエンジニアの増加速度の7倍の速さで膨張し続けていた。その結果、エンジニアが新機能を作る時間より既存コードのメンテナンスに費やす時間が増え続けた。この問題を解決するために始まったのがコード自動化への取り組みだ。
導入前の状況:以前は「このJavaバージョンからこのバージョンに上げてください」という通知を何百チームに送り、それぞれが対応するという方式だった。一度の移行に数ヶ月かかっていた。エンジニアリングサーベイでは「移行作業が最も不満な仕事」と回答されていた。
導入後:Fleet Shiftが変更を計画し、Honkが実行する。最近のJavaバージョン移行は3日で完了した。
HonkアーキテクチャとClaude Agent SDK
Honkは当初、LLMを使わない確定的スクリプトベースのコード変換ツールとして始まった。しかし複雑な変換(APIコール置換など)では、コードの表現バリエーションが多すぎてスクリプトが無限に複雑になる問題に直面した。これは「Hyrum’s Law」として知られる現象で、「すべての可観測な挙動は誰かに依存されている」という原則だ。
そこでLLMへの移行を試みた。初期は「モデルが賢くない」ためうまくいかなかったが、反復を重ねてパターンを発見し、モデルの改善とともに実用化した。現在のHonkはClaude Agent SDKをKubernetesポッドの内部に包み込む構造を持つ。
主な構成要素は以下だ。
- Claude Agent SDK:コアのエージェントロジックを担当
- Kubernetes Pod:各移行タスクを独立したコンテナとして実行。クラウド環境内で多数を並列スケジューリング可能
- 検証ツール群:複数OS対応のCIビルド(Spotifyはクライアントが多様なOSで動くため複数OSでのビルド確認が必須)、リントチェック
- Fleet Shiftとの連携:どのリポジトリにどの変更を適用するかのスケジューリングはFleet Shiftが担当
エージェントはビルドが通るかどうかを自分で確認しながらコード変更を行う。ビルドが失敗すれば修正し、再度ビルドする。この自己検証ループが自律的な実行を可能にしている。
以下はClaude Agent SDKを使ってHonkに近い構造を実装する簡略例だ。
import anthropic
client = anthropic.Anthropic()
TOOLS = [
{
"name": "run_ci_build",
"description": "Run CI build for current code and return pass/fail with error log",
"input_schema": {
"type": "object",
"properties": {
"target_os": {
"type": "string",
"description": "Target OS: linux, macos, windows"
}
},
"required": ["target_os"]
}
},
{
"name": "read_source_file",
"description": "Read source file content from repository",
"input_schema": {
"type": "object",
"properties": {
"path": {"type": "string", "description": "File path relative to repo root"}
},
"required": ["path"]
}
},
{
"name": "write_source_file",
"description": "Write modified content back to source file",
"input_schema": {
"type": "object",
"properties": {
"path": {"type": "string"},
"content": {"type": "string"}
},
"required": ["path", "content"]
}
},
{
"name": "run_lint",
"description": "Run lint checks and return violations if any",
"input_schema": {
"type": "object",
"properties": {
"path": {"type": "string"}
},
"required": ["path"]
}
}
]
def run_honk_migration(migration_spec: str, repo_path: str) -> dict:
"""Honk風の自動移行エージェントを実行する"""
messages = [
{
"role": "user",
"content": (
f"Migration task: {migration_spec}\n"
f"Repository: {repo_path}\n\n"
"Apply the migration across the codebase. "
"After each significant change, verify with CI builds on Linux and macOS. "
"Fix any lint violations immediately. "
"Only report completion when all builds pass and no lint errors remain."
)
}
]
while True:
response = client.messages.create(
model="claude-opus-4-7",
max_tokens=8192,
tools=TOOLS,
messages=messages
)
if response.stop_reason == "end_turn":
return {"status": "complete", "repo": repo_path}
tool_results = []
for block in response.content:
if block.type == "tool_use":
result = execute_tool(block.name, block.input, repo_path)
tool_results.append({
"type": "tool_result",
"tool_use_id": block.id,
"content": result
})
messages.append({"role": "assistant", "content": response.content})
if tool_results:
messages.append({"role": "user", "content": tool_results})
Fleet ShiftはHonkへの入力仕様(どのリポジトリにどの変更を適用するか)をYAML形式で記述する。実際の設定イメージはこうだ。
# fleet-shift-migration.yaml の構造イメージ
shift_id: java-17-upgrade-2026-q2
description: "全バックエンドサービスをJava 11からJava 17にアップグレード"
target_repos:
- pattern: "backend-*"
exclude: ["backend-legacy-*"]
honk_config:
model: claude-opus-4-7
max_retries: 3
verification:
build_targets: [linux, macos]
lint_checks: enabled
auto_merge:
enabled: true
required_checks: [ci-build, lint]
confidence_threshold: 0.85
BackstageのMCP化:AIエージェントがSlack経由でPRを作る世界
Spotifyは長年「Backstage」というオープンソースの開発者ポータルを運営している。もともとは「数百あった社内ツールを1つのガラス窓にまとめる」という発想で生まれた。Backstage自体はオープンソース化されており、多くの企業で採用されている。
コンポーネントのカタログを中心に、CI・デプロイ・ABテスト・オーナー情報などを統合した開発者ポータルだ。導入前は「インシデントが起きてもそのコンポーネントのオーナーを特定できなかった」という状況だったという。Backstageで全コンポーネントのオーナー・状態・依存関係が一元管理されるようになった。
現在Spotifyは、Backstageの機能全体をMCPサーバーとCLIツールとしてエージェントに公開している。これによりClaudeは以下の操作を自律的に行える。
- コンポーネントのオーナーを調べる
- オーナーチームにSlack通知を送る
- インシデント対応中に関連チームをエスカレーション
- コンポーネントの依存関係グラフを参照する
さらに実用化が進んでいるのがSlack経由のHonk呼び出しだ。開発者がSlackチャンネルで「@honk このAPIをv2に移行してくれ」と書くと、HonkがPRを作ってリプライする。Slackを使ったヒューマン・エージェント協働の最もシンプルな形だ。
Honk v2 Preview:マルチプレイヤー・エージェントオーケストレーション
2026年5月のHack Weekに合わせてHonk v2のプレビューがリリースされた。スライドには以下の新機能が示されていた。
- Agent orchestration UI(Chirp):複数エージェントセッションを視覚的に管理・調整する独自UI
- Collaboration in shared sessions and projects:複数の開発者が同じエージェントセッションを同時参照・介入できる(Google Docsのリアルタイム協働に相当)
- Teleporting:セッションを別の環境やコンテキストに即座に移行する機能(詳細は未公開)
Chirpの特徴は以下だ。
- 複数エージェントセッションの並列実行と調整
- プロジェクト単位の管理:チームで取り組む大きな機能を複数のHonkセッションに分割して管理
- あらゆるデバイスからアクセス可能
「今まで一人の開発者の前に一体のエージェントがいるというモデルだったのが、チームでエージェントと協働するモデルに移行する」という変化がHonk v2には込められている。
「技術の種類を絞れ」:Spotifyが15年かけて辿り着いたエージェント最適化の哲学
Spotifyが強調した中で、他の事例とは異なる洞察が「コードベースの一貫性がエージェント性能を左右する」という発見だ。
15年以上「使用する技術の種類を絞り込む」という原則を持っていたSpotifyは、AIの時代になってもこの方針が正しかったことを確認した。
担当者の言葉を引用する。
「Claudeが参照できるコードが多く、しかもそのコードが一貫したスタイルであればあるほど、Claudeはより良い仕事をする。逆に断片化したコードベースではClaudeのパフォーマンスが落ちるのを実際に確認している」
スライドに映し出された言葉は端的だった。
“The fewer technologies we are world-leading in, the faster we go.”
(世界トップクラスの技術を絞れば絞るほど、速く進める。)
この観察を支える仕組みが「ゴールデンステート」だ。コンポーネントの種類ごとに「推奨される技術スタック・設計パターン」を定義し、BackstageのSoundcheckというUIで各チームが自己評価できる。
そして設計パターンの違反はリントチェックとして実装されている。Claudeがコードを変更する際、推奨外の方法でgRPC呼び出しを書こうとすると、リントチェックが即座にフィードバックする。Claudeはそのフィードバックを受けて修正する。
人間開発者にとっても、エージェントにとっても同じルールが適用される。この統一性が「エージェントが自動修正できる環境」を実現している。
ハーネスエンジニアリング完全解説:Claude Codeソースから読む5層モデル・クエリループ・コンテキスト管理では、ClaudeがリントフィードバックをQueryLoop内でどう処理するかの実装詳細を解説している。
Microsoft Azure AI Foundry × Claude:エンタープライズAIの新標準プラットフォーム
Microsoftのセッションは「Build AI Agents using Claude in Microsoft Foundry」という実践的なワークショップだった。登壇したのはMicrosoft Senior Cloud AdvocateのMarlene Mhangamiとその同僚たち。34分で参加者が実際にAzure AI FoundryにClaudeエージェントをデプロイするという構成だ。
Azure AI Foundryとは
Azure AI Foundryは、AIアプリケーションとエージェントを企業規模で構築するための統合プラットフォームだ。VS Code・GitHub・Copilot Studioなど既存の開発ツールと統合して使える。
主な機能は4つに分類される。
- Models:Claude Sonnet 4.6 / Opus 4.7を含む多数のモデル。プレイグラウンド環境でシステムプロンプトを変えながらモデルを比較できる
- Agent Service:エージェントの作成・管理・オーケストレーション
- Tools・統合:1,400以上のMCPツールとコネクタ(Adobe・Atlassian・SAP・ServiceNow・UiPath・Microsoft Bing・Microsoft Fabric・Microsoft OneLake等との接続を含む)
- Machine Learning:ファインチューニング・評価・モニタリング
エンタープライズセキュリティの統合
.envファイルで認証情報を管理し続けることへのセキュリティ懸念に対し、FoundryはMicrosoft Entra・Defender・Purviewとの統合によってセキュアな認証・コンプライアンス・ガバナンスを提供する。プロトタイプから本番への移行を、セキュリティアーキテクチャを再構築することなく行えるという主張だ。
Microsoft Agent FrameworkでClaudeエージェントを実装する
ワークショップの技術的な核心はMicrosoft Agent Framework(Pythonオープンソース)を使ったエージェント実装だ。ワークショップでは「Sparkles Cupcake Shop」というカップケーキショップのAIエージェントを実際に構築した。参加者はlabclient.labondemand.comのクラウド環境で1時間かけて実際に手を動かした。
# Microsoft Agent Framework を使ったエージェント構築の基本構造
import os
from agent_framework.foundry import AnthropicFoundryChatClient
from dotenv import load_dotenv
load_dotenv()
# Foundry認証情報 — .envから読み込む
# MODEL_DEPLOYMENT="claude-sonnet-4-6"
chat_client = AnthropicFoundryChatClient(
model=os.environ["MODEL_DEPLOYMENT"],
api_key=os.environ["FOUNDRY_API_KEY"],
base_url=os.environ["FOUNDRY_ENDPOINT"] # エンドポイントは /anthropic で終わる形式
)
# MCPサーバーをツールとして接続(URLを渡すだけ)
mcp_tool = MCPStreamableHTTPTool(
name="cupcake-store",
url=os.environ["CUPCAKE_MCP_SERVER_URL"]
)
await mcp_tool.connect()
# エージェント定義
agent = Agent(
client=chat_client,
name="cupcake-agent",
tools=mcp_tool,
)
# セッション作成 → 対話ループ
session = agent.create_session()
print("Type 'exit' to quit.\n")
while True:
user_input = input("You: ")
if user_input.lower() == "exit":
break
response = await session.send_message(user_input)
print(f"Assistant: {response}")
ワークショップで使ったMCPサーバーは以下の3種類のリソースを提供していた。
- Tools(関数):在庫確認・注文作成・注文ステータス確認などのAPI呼び出し
- Prompts(再利用可能な指示):エージェントの人格設定・応答スタイル・ウェルカムバナーなどを外部から注入できる
- Resources(データ):HTTP経由で送信される構造化データ(メニュー一覧など)
MCPの強みは「URLを渡すだけで完全なAPIがエージェントから利用可能になる」点だ。これがFoundryの1,400以上のコネクタに共通する接続インターフェイスでもある。
MCPサーバー構築ガイド2026:接続から本番デプロイまででは、こうしたMCPサーバーの設計と実装を詳しく解説している。
SpotifyとMicrosoftのアーキテクチャ比較
2社の講演から見える技術的な位置付けの違いを整理する。
| 比較項目 | Spotify | Microsoft Azure AI Foundry |
|---|---|---|
| エージェント基盤 | 内製 Honk + Chirp | Microsoft Agent Framework(OSS) |
| モデル利用方法 | Agent SDK直接 + Kubernetes | Foundryプラットフォーム経由 |
| ツール統合 | Backstage MCP + 社内ツール | 1,400+既製MCPコネクタ |
| スケーリング | Kubernetesポッド並列 | Azure インフラで自動スケール |
| 認証・セキュリティ | 社内インフラ | Entra + Defender + Purview統合 |
| ターゲット | 自社エンジニア向け生産性 | 汎用エンタープライズ向け |
| コア Claude モデル | Opus 4.7(高複雑タスク) | Sonnet 4.6(標準) + Opus 4.7(高度推論) |
| MCPの位置付け | Backstageの公開方法 | 接続インターフェイスの標準 |
| 月間エージェントPR | 1,000件超(本番自動マージ) | N/A(汎用プラットフォーム) |
Spotifyのアプローチは「自社の問題を深く解決するために最適化」されており、Kubernetesによる並列実行・社内Backstageとの統合・フリート規模のコード変換という固有の要件に特化している。
MicrosoftのFoundryは「あらゆる企業が似た問題を解決できる汎用基盤」を目指しており、1,400+コネクタで「自社でMCPサーバーを構築しなくてもよい世界」を提供しようとしている。
どちらの道を選ぶかは、組織の規模・既存インフラ・自前開発の余力によって変わる。しかし両社がClaude Opus 4.7を最高品質タスクのコアモデルとして位置付けるという点は一致している。
リポジトリ横断スケジューラ"] --> Honk["Honk
Claude Agent SDK on K8s"] Honk --> VerifyBuild["CIビルド検証
Linux + macOS"] Honk --> VerifyLint["リントチェック
即時フィードバック"] VerifyBuild --> AutoMerge{"CIパス?"} VerifyLint --> AutoMerge AutoMerge -- Yes --> Merge["自動マージ
月間1,000件超"] AutoMerge -- No --> Honk Backstage["Backstage
MCPサーバー"] --> Honk Slack["Slack
honk メンション"] --> Honk Chirp["Honk v2
Chirp オーケストレーション"] --> Honk
2社の事例から見えるエンタープライズAI共通原則
表面的な違いの裏に、2社が収束しているパターンがある。
原則1:ツール統合がエージェントの価値を決める
SpotifyのHonkは「CIビルドを自分で実行できること」で初めて自律的に動く。MicrosoftのFoundryは「1,400以上のコネクタを手軽に追加できること」を価値として訴求する。モデルの賢さより、何にアクセスできるかがエージェントの実用性を決める。
原則2:検証ループが自律実行を可能にする
SpotifyのHonkは変更を加えた後に自分でCIを走らせる。これがないと自動マージはできない。Microsoftのワークショップでも「エージェントはMCPサーバーから最新情報を取得してから回答する」という構造を示した。フィードバックループのない一方向の実行はエンタープライズ環境では機能しない。
原則3:人間の判断は意思決定に集中する
Spotifyでは今、「PR頻度76%増・63%がAI支援」という環境で「信頼できると判断したPRは自動マージし、人間のレビューが本当に必要な箇所に集中する」という方向に動いている。人間の役割が「コードを書く」から「何をどこまで自動化するかを判断する」に変化している。
原則4:エージェントはコードベースを標準化することで強化される
Spotifyの観察は他の組織にも適用できる。レガシーコードとモダンコードが混在し、フレームワークが多様なコードベースでは、エージェントのパフォーマンスが低下する。「技術の種類を絞る」というSpotifyの哲学がAIの時代に再び証明された。
ClaudeチームThariqが明かしたSkills設計9カテゴリ:Anthropic社内で数百個動かす実践則では、エージェントスキルの設計原則についてAnthropicの視点からまとめている。
コーディングボトルネックの解消と次の制約
Spotifyの担当者が講演末尾で示した洞察は示唆に富んでいる。
「コーディングはこれまで製品開発の主要ボトルネックだった。それが解消されつつある。しかし新たなボトルネックが人間の意思決定にある。何をユーザーに届けるか、どのアイデアを試すか。コーディングが制約でなくなると、そういった意思決定をこれまで以上の頻度で行わなければならなくなる」
この変化は具体的に現れている。Spotifyでは今、誰でも「Claudeで本番コードベースにプロトタイプを作れる」という状態になっている。CEOを含む非エンジニアが自分のアイデアをClaudeでプロトタイプし、それを社内の人に見せてフィードバックをもらうサイクルが生まれている。プロトタイプは「数日〜数週間」から「数分」に短縮された。
この変化が示すのは、2026年のエンタープライズAI導入の成熟度だ。Claude Codeを試している段階から、組織全体の意思決定と実行サイクルに組み込まれた段階へと移行しつつある。
まとめ:2026年エンタープライズAI最前線の3つの結論
2本の講演から導き出せる技術的な結論は3つだ。
1. Claude Opus 4.5〜4.7が「実用閾値」を越えた
SpotifyのデータはOpus 4.5リリース後に採用曲線が垂直に立ち上がったことを示している。「AIツールを試した」から「AIツールなしでは開発できない」への転換点がここにある。Opus 4.7はMicrosoftでも「デイリードライバー」として採用されている。99%のエンジニアが毎週AIコーディングを使い、全PRの63%がAI支援という数字は、この転換点を越えた組織の現実だ。
2. 内製ツールとプラットフォームの2つの道がある
SpotifyはAgent SDKと独自インフラで深く統合し、MicrosoftはFoundryで横断的な標準基盤を提供する。どちらも「Claude + ツール統合 + 検証ループ」という構造は同じだ。組織の規模と要件に応じて選択する。
3. エンジニアリング文化とコードベースの質がエージェントの上限を決める
Spotifyが示したのは、AIエージェントの性能がモデルだけで決まるのではないという事実だ。コードの一貫性・テストカバレッジ・リントルールの整備・ツールへのアクセス。そして「技術の種類を絞る」という哲学。これらが整っている組織ほど、エージェントは高い自律性を発揮できる。
エンタープライズAIの競争優位は、モデル選択ではなく「エージェントが効果的に動ける環境を整備できるか」に移行しつつある。
参照ソース
- 0xMovez: Spotify Chief Architect at Anthropic Stage (X, 2026-05-19) — 27分講演を紹介したツイート(本記事で動画スクショ・文字起こし分析)
- 0xMovez: Microsoft AI Developer Workshop at Anthropic Stage (X, 2026-05-20) — 34分ワークショップを紹介したツイート(本記事で動画スクショ・文字起こし分析)
- Anthropic: Claude Agent SDK ドキュメント — HonkとMicrosoft Agent Frameworkが利用するAgent SDKの公式ドキュメント
- Microsoft Azure AI Foundry ドキュメント — Azure AI Foundryの公式ドキュメント(aka.ms/FoundryDocumentation)