2026年4月16日、OpenAIはコーディングエージェント「Codex」の大型アップデートを発表した。週間アクティブユーザーは300万人を超え、3ヶ月で5倍に成長している。
▶ OpenAI公式デモ動画を見る
Codex Computer Use デモ — X (OpenAI公式)
今回のアップデートの核心は、Codexがターミナルとエディタの枠を完全に超えたという点だ。Mac上のあらゆるアプリを操作し、画像を生成し、過去の作業を記憶し、数日〜数週間にわたるタスクを自律的に継続する——いわば「AIスーパーアプリ」への第一歩だ。
主要な新機能を整理する。
| 新機能 | 内容 | 対抗製品 |
|---|---|---|
| Computer Use | Macアプリをバックグラウンドで自律操作 | Anthropic Computer Use |
| 画像生成 | gpt-image-1.5による統合画像生成 | — |
| メモリ | ユーザーの作業スタイル・スタックを記憶 | Claude Code CLAUDE.md |
| 111プラグイン | MCP・アプリ統合・スキル連携 | Claude Code MCP |
| インアプリブラウザ | Webページへの直接コメント・指示 | — |
| スレッド自動化 | 数日〜週単位のタスク自律継続 | Claude Code /loop |
今回最も注目すべき機能がComputer Useだ。Codexが独自のカーソルを持ち、Macのデスクトップアプリケーションを画面を見ながらクリック・タイピングで操作する。
従来のCodex:
ターミナル → コード実行 → 結果確認
新しいCodex:
ターミナル + エディタ + ブラウザ + Figma + Slack + あらゆるMacアプリ
→ 画面を認識 → クリック・タイピング → 結果確認 → 次のアクション
重要なのは、複数のエージェントがバックグラウンドで並列実行できる点だ。ユーザーが自分の作業をしている間に、Codexは別のデスクトップセッションでテスト実行やアプリ操作を行う。ユーザーの作業を邪魔しない。
Codex開発チームのAri Weinsteinは「エージェントがバックグラウンドでアプリを使っている間、自分も同時にMacを使える。この感覚は魔法のようだ」と表現している。
Computer Useでは、アプリ名を指定する方法とタスクの内容からCodexが最適なアプリを判断する方法の2通りがある。OpenAIは独自の「秘密のソース」技術により、エージェントがアプリを操作してもシステム全体が重くならないと説明している。
実際のユースケースを整理する。
| 操作例 | 従来の方法 | Codex Computer Use |
|---|---|---|
| Xcodeでビルド&テスト | 手動でXcode操作 | 「Xcodeを開いてビルドしてテスト結果を報告」 |
| Figmaからデザイン取得 | Figma APIまたは手動コピー | 画面認識でFigmaからデザインスペックを読み取り |
| API非対応の社内ツール操作 | 人間が手動操作するしかない | 画面を見てクリック・入力で操作 |
| フロントエンドの実機テスト | Playwrightやcypress | 実際のブラウザを開いて目視レベルの確認 |
この機能はAnthropicの「Computer Use」に対する直接的な回答だ。ただし現時点ではmacOSのみの対応で、EU・UK・スイスでは利用できないという制限がある。
# Codex CLI v0.121.0 での操作例
# 1. アプリ名を指定して操作
codex "Xcodeを開いてプロジェクトをビルドし、テスト結果をレポートして"
# 2. タスクを伝えてCodexに最適なアプリを選ばせる
codex "このAPIレスポンスをPostmanで検証して、エラーがあれば報告して"
# 3. 複数アプリをまたぐ操作
codex "Figmaの最新デザインを確認して、フロントエンドのコードを修正して、
Slackの#dev-reviewチャンネルにスクリーンショット付きで報告して"
# 4. バックグラウンド並列実行
codex exec "テストを全て実行して、失敗したケースのデバッグを進めて"
# ↑ ユーザーは自分のMac作業を続けながら、Codexが裏で動く
OpenAIのAtlas技術をベースにしたブラウザがCodex内に統合された。localhost上のWebアプリや公開ページを開き、ページ上の特定の要素に直接コメントを付けて修正指示を出せる。
Codex開発チームのデモでは、グラフのY軸が切れている問題に対して、ブラウザ上でその箇所を指し「マージンを広げてY軸が切れないように修正して」とコメントすると、Codexが即座にCSSを修正してリロードする様子が実演された。
操作フロー:
1. Codex内でブラウザを開く(localhost:3000 or 公開URL)
2. ページ上の気になる箇所をクリック
3. コメントで修正指示を入力
「このグラフのマージンを広げてY軸が切れないようにして」
4. Codexがソースコードを特定→修正→自動リロード
5. 確認してOKなら次の指示へ
現時点ではフロントエンド開発とゲーム開発が主なターゲットだが、将来的にはより広いWebアプリケーション開発に対応する予定とのこと。
Codex内で画像生成が完結するようになった。ChatGPTアプリに切り替える必要がない。
OpenAIの説明によれば、スクリーンショットを撮ってCodexに見せることで「正しい方向に進んでいるか」を視覚的に検証する使い方もできる。デザインの意図をコードに正確に反映できているかを、AIが画像レベルで確認するわけだ。
具体的なユースケースは以下の通り。
| ユースケース | 操作例 |
|---|---|
| UIモックアップ | 「ダッシュボードのヒーローセクションをダークテーマで生成して」 |
| ゲームアセット | 「8-bitスタイルのキャラクタースプライトを生成して」 |
| プロダクトコンセプト | 「このワイヤーフレームをリアルなUIデザインに変換して」 |
| 実装検証 | スクリーンショットを撮影→Figmaデザインと比較→差分を指摘 |
具体的な操作フロー:
1. Codexに「ダッシュボードのログインページをデザインして」と指示
2. gpt-image-1.5がモックアップ画像を生成
3. 「このデザインをReactコンポーネントで実装して」と続ける
4. Codexがコードを生成→ブラウザでプレビュー
5. スクリーンショットを撮って元のモックアップと比較
6. 差分があれば自動修正→繰り返し
これにより、デザイン→コード→テスト→デプロイのサイクル全体をCodex内で回せるようになる。
Codexにパーソナライゼーション(メモリ)機能が追加された。
| 記憶する内容 | 具体例 |
|---|---|
| 技術スタック | 「このプロジェクトはNext.js + Prisma + Vercel」 |
| コーディング規約 | 「変数名はcamelCase、テストはVitest」 |
| 作業パターン | 「PRはsquash merge、CIはGitHub Actions」 |
| 頻繁な指示 | 「TypeScriptの型は厳密に、any禁止」 |
AnthropicのClaude Codeでは、CLAUDE.mdファイルにプロジェクトルールを手動で記述するアプローチを取っている。Codexのメモリはこれを自動化する発想だ。使い続けるほどCodexがユーザーの好みを学習し、プロンプトの提案も自動生成される。
# Codex CLI — メモリの管理
codex memory list # 記憶している内容を一覧表示
codex memory reset # メモリをリセット
codex memory mode off # メモリ機能を無効化
メモリ機能には2つのレベルがある。
レベル1: コンテキスト記憶 — 過去のタスクで使った技術スタック、コーディング規約、よく使うコマンドなどを記憶する。次のセッションで「前回と同じ設定で」と言えば、設定をゼロから説明する必要がない。
レベル2: プロアクティブ提案 — Codexが状況を察知して「やるべきこと」を先回りで提案する。Engadgetのレポートによれば、デモでは同僚がGoogle Docsのドラフトにコメントを残したことをCodexが検知し、「このコメントに返信しますか?」と提案する様子が実演された。
プロアクティブ提案の例:
[Codex] 💡 提案: 山田さんがdesign-spec.gdocにコメントを残しました
「フォントサイズを14pxに変更希望」
→ このコメントに対応してCSSを修正しますか? [はい / 後で]
[Codex] 💡 提案: CIが失敗しています(test_auth.py::test_login)
前回同じテストが失敗した時は、環境変数 DB_URL の設定漏れでした
→ 確認しますか? [はい / 後で]
ただし、この「自動記憶」と「先回り提案」アプローチにはプライバシー面の懸念もある。Enterprise・Eduプランでは段階的なロールアウトとなっており、EU/UKでは利用開始が遅れる。
OpenAIは今回のアップデートで111個の新プラグインを追加した。スキル、アプリ統合、MCPサーバーを組み合わせ、Codexのコンテキスト収集と実行能力を拡張する。
主な統合先は以下の通り。
| カテゴリ | 対応ツール |
|---|---|
| プロジェクト管理 | JIRA, Linear, Notion |
| バージョン管理 | GitHub, GitLab |
| CI/CD | CircleCI, GitHub Actions |
| コミュニケーション | Slack, Microsoft Teams |
| デザイン | Figma |
| オフィス | Microsoft Suite |
# マーケットプレイスからプラグインをインストール(v0.121.0)
codex plugin install jira-integration
codex plugin install gitlab-mcp
codex plugin install figma-design
# GitHub URL・git URL・ローカルディレクトリからもインストール可能
codex plugin install https://github.com/user/my-codex-plugin.git
codex plugin install ./local-plugin/
Claude CodeのMCP(Model Context Protocol)との違いは、OpenAIがマーケットプレイス方式でプラグインの発見・インストールを一元化している点だ。MCPはオープンプロトコルだが、Codexはプラグインストアのようなエコシステムを構築しようとしている。
CodexにThread Automations(スレッド自動化)が追加された。会話スレッドのコンテキストを保持したまま、スケジュールされたタイミングで自律的に作業を再開する。
従来: 1回の会話 → タスク完了 → 終了
新機能:
Day 1: 「このリファクタリングを進めて」
Day 2: Codexが自動的にウェイクアップ → 続きの作業を実行
Day 3: 進捗をユーザーに報告 → 次のステップを提案
Day 7: 全工程完了 → PRを作成
これはClaude Codeの/loopコマンド(定期実行)に近い概念だが、日単位・週単位という長期スパンで自律的に動くという点で、一歩先を行っている。
今回のアップデートはアプリ版(v26.415)とCLI版(v0.121.0)の両方に及ぶ。
アプリ版 v26.415(2026年4月16日):
CLI版 v0.121.0(2026年4月15日):
# 主要な新コマンド
codex plugin install <source> # マーケットプレイス/GitHub/ローカルからプラグイン追加
codex memory list # メモリ一覧
codex memory reset # メモリリセット
# TUI改善
Ctrl+R # 逆方向の履歴検索(シェルのreverse search相当)
# セキュリティ
# bubblewrapサポートのセキュアdevcontainerプロファイル追加
# サプライチェーン強化(GitHub Actions・cargo依存のピン留め)
今回のアップデートにより、CodexとClaude Codeの競合関係がさらに鮮明になった。
| 機能 | Codex (v26.415) | Claude Code |
|---|---|---|
| デスクトップ操作 | ✅ Computer Use(macOS) | ✅ Computer Use(Linux/macOS) |
| 画像生成 | ✅ gpt-image-1.5内蔵 | ❌ 非対応 |
| メモリ | ✅ 自動学習型 | ✅ CLAUDE.md(手動定義) |
| プラグイン | ✅ 111個 + マーケットプレイス | ✅ MCP(オープンプロトコル) |
| ブラウザ | ✅ インアプリブラウザ | ❌ WebFetchツール |
| 長期タスク | ✅ 日〜週単位の自動化 | ✅ /loop + cron |
| IDE統合 | VS Code, JetBrains | VS Code, JetBrains |
| 週間ユーザー | 300万人 | 非公開 |
| 対応OS | macOS(Intel含む) | macOS, Linux, Windows |
| EU/UK | 一部機能制限あり | 制限なし |
OpenAIはマーケットプレイス + 自動メモリ + 画像生成という「囲い込み型」のエコシステムで攻めている。一方、AnthropicのClaude CodeはCLAUDE.md + MCP + フルオープンという「透明性重視」のアプローチだ。
どちらが勝つかはまだわからない。だが、2026年4月時点で確実に言えるのは、コーディングエージェントの戦場がターミナルからデスクトップ全体に広がったということだ。
Engadgetは今回のアップデートを「OpenAIのスーパーアプリ構想への布石」と評している。Codexは単なるコーディングツールではなく、開発者の作業環境全体を統合するハブになろうとしている。
これらすべてが1つのアプリで完結する世界。それがOpenAIの描くCodexの未来だ。
開発者としては、特定のツールに依存しすぎないことが重要だろう。Codexのマーケットプレイスに乗るか、MCPのオープンエコシステムに賭けるか——あるいは両方を使い分けるか。選択の時が来ている。