この記事ではAIコーディングツールに特化して解説します。AIエージェントの全体像から学びたい方は AIエージェントとは?仕組み・種類・自律レベル・主要フレームワークを2026年最新版で解説 をあわせてご覧ください。

この記事のポイント
  • OpenAI Codex CLIはターミナルで動くOpenAI公式のコーディングエージェント。GPT-5.5系を既定に、ファイル編集・コマンド実行・差分提案までを自然言語で回せる
  • 導入はnpm / Homebrew / 公式スクリプトの3通り。ChatGPTサインインかAPIキーで認証し、既定はネットワーク遮断の workspace-write サンドボックスで安全に動く
  • Claude Code / Cursor / Aider / Clineとの違い、料金プラン、エンタープライズ運用までを一次ソースで整理。どのツールを軸にするかの判断材料を提示する

30秒で理解するOpenAI Codex CLI

まず全体像を短く押さえる。OpenAI Codex CLIは、ChatGPTを開かずにターミナルから直接コードを書かせるための公式ツールだ。要点は次の通り。

ターミナル常駐のコーディングエージェント。自然言語の指示でコード生成・修正・実行・テストまでを一気通貫で回せる
・中核はRust製で起動が速く、macOS・Linux・Windowsに対応。VS Code / Cursor / Windsurf向けのIDE拡張も用意される
・認証はChatGPTサインイン(Plus/Pro/Business等)かAPIキーの2通り。普段ChatGPTを使うなら追加課金なしで始めやすい
・既定モデルはGPT-5.5系/model で切り替え、model_reasoning_effort で推論の深さを調整できる
・既定でネットワーク遮断のサンドボックスworkspace-write)が効き、危険な操作は承認を挟む安全設計

「codex 使い方」「codex cli」で検索する人の多くは、まず動かす手順と、Claude Codeなど他ツールとの違いを知りたいはずだ。この記事はその両方を、OpenAI公式ドキュメントとGitHubリポジトリを一次ソースに整理する。AIコーディング全般の選び方は Claude CodeとCursorはどっちを使うべきか|2026年最新比較 も参考になる。

OpenAI Codex CLIとは

OpenAI Codex CLIは、OpenAIが公開するオープンソース(Apache-2.0)のコーディングエージェントだ。GitHubの openai/codex リポジトリで開発され、コードベースの大半がRustで書かれている。ターミナルで codex と打つとTUI(テキストUI)が立ち上がり、そこに日本語や英語で「このバグを直して」「テストを追加して」と書くだけで作業が進む。

ポイントは、単なる補完ではなくエージェントとして動くことだ。指示を受けると、Codexはファイルを読み、計画を立て、必要なシェルコマンドを実行し、差分を提案する。実行前には承認を挟む設計になっており、人間がレビューしながら自動化を進められる。GitHub Copilotのインライン補完とは設計思想が異なる。Copilotの全体像は GitHub Copilotの使い方|導入・基本操作・Agent Mode・料金体系を2026年最新版で解説 で詳しく扱っている。

何ができるのか

Codex CLIの主な守備範囲は次の通りだ。エディタを離れずに、要件定義に近い粒度の指示をそのまま渡せるのが強みになる。

コード生成・リファクタリング。複数ファイルにまたがる変更も、依存関係を読んで一括で提案する
バグ修正とテスト。失敗するテストを起点に原因を探り、修正と追加テストまで回せる
コマンド実行。ビルド・lint・テスト・gitなどをサンドボックス内で実行し、結果を踏まえて次の手を打つ
コードレビュー。コミット前に別のCodexエージェントに差分をレビューさせる機能を備える
画像入力。スクリーンショットやデザイン仕様を渡して、UIの実装やバグ再現に使える
Web検索とMCP。最新情報の取得や、MCP(Model Context Protocol)経由で外部ツール・コンテキストを接続できる

旧Codex(2021年)との違い

検索で混同されやすいのが、2021年にOpenAIが発表した「Codex」だ。当時のCodexはGitHub Copilotの裏側で動いたコード生成API用のモデルで、2023年に旧APIは提供終了している。現行のCodexは名前こそ同じだが、モデルではなくエージェント型のCLI/アプリ製品を指す。中身のモデルはGPT-5.5系に置き換わり、ターミナル・IDE拡張・クラウド版・iOS/Androidまでを含む製品群へと拡張された。本記事が扱うのはこの現行のCodex CLIである。

CLI・IDE拡張・クラウド版・モバイルの関係

現行のCodexは単一のCLIではなく、同じエージェントを複数の入口から使える製品群だ。入口ごとに得意な場面が違うため、組み合わせて使うと効果が高い。

CLI:ターミナルに常駐し、重い自動化・スクリプト連携・CI組み込みに向く。本記事の主役
IDE拡張:VS Code / Cursor / Windsurf内でエディタと一体で使う。軽い編集やレビューに向く
クラウド版(chatgpt.com/codex):ブラウザからクラウドVM上でタスクを並列実行できる。ローカル環境を汚さずに大きな作業を回せる
モバイル(iOS/Android):外出先から進捗確認やリモート操作ができる。長時間タスクの監視に便利

ローカルで完結させたいか、クラウドに逃がしたいかで入口を選ぶとよい。CLIで指示を出し、クラウドVMで実行し、モバイルで進捗を見る、といった横断運用もできる。なお同時期にGitHub Copilotもネイティブアプリ化と既定モデルの刷新を進めており、AIコーディング全体がデスクトップ常駐+クラウド実行へ向かっている。背景は GitHub Copilotがネイティブアプリ化、デフォルトモデルもPolarisへ——Build 2026の主戦場 で詳しく扱っている。

導入手順(5分で開始)

導入は3通りある。普段の環境に合わせて選べばよい。ここではmacOS / Linuxを中心に説明する。

1. インストール

最も手軽なのはパッケージマネージャ経由だ。Node.jsが入っていればnpmが速い。

# npm(グローバルインストール)
npm install -g @openai/codex

# Homebrew(macOS / Linux)
brew install --cask codex

パッケージマネージャを使わない場合は、公式インストールスクリプトを使う。CI環境では無人インストール用の環境変数 CODEX_NON_INTERACTIVE=1 を併用できる。

# macOS / Linux
curl -fsSL https://chatgpt.com/codex/install.sh | sh

# Windows(PowerShell)
powershell -ExecutionPolicy ByPass -c "irm https://chatgpt.com/codex/install.ps1 | iex"

インストール後、codex --version でバージョンを確認しておくと安心だ。2026年6月時点では 0.137.0 系が最新で、更新は頻繁に行われている。

2. 認証(ChatGPTサインイン or APIキー)

初回に codex を実行すると認証を求められる。推奨はChatGPTアカウントでのサインインで、Plus・Pro・Business・Edu・Enterpriseのいずれかのプランがあれば、追加のAPI課金なしでそのまま使える。

# 初回起動。表示される指示に従い「Sign in with ChatGPT」を選ぶ
codex

CIやサーバなどブラウザを開けない環境では、APIキー方式が向く。環境変数に鍵を入れておけば、サインインのフローを省ける。

# APIキー方式(従量課金)
export OPENAI_API_KEY="sk-..."
codex

3. 初期セットアップと設定ファイル

挙動は ~/.codex/config.toml(ユーザ全体)または各プロジェクトの .codex/config.toml で調整する。最初に押さえるべきは、使用モデル・推論の深さ・承認ポリシー・サンドボックスの4つだ。

# ~/.codex/config.toml の例
model = "gpt-5.5"
model_reasoning_effort = "medium"   # low / medium / high / xhigh
approval_policy = "on-request"      # untrusted / on-request / never
sandbox_mode = "workspace-write"    # read-only / workspace-write / danger-full-access

[shell_environment_policy]
inherit = "core"
exclude = ["*_TOKEN", "*_SECRET"]   # 機密の環境変数を子プロセスに渡さない

この設定なら、作業ディレクトリ内でのみ書き込みを許し、トークン類は子プロセスに漏らさず、判断に迷う操作だけ承認を挟む。まずはこの「最小権限」から始めて、信頼できる作業だけ権限を緩めるのが安全な進め方だ。

AGENTS.mdでプロジェクトの作法を伝える

Codexは、リポジトリ直下に置いた AGENTS.md を読み、プロジェクト固有のルールを前提に動く。コーディング規約・使うパッケージマネージャ・テストの流し方・触ってはいけない領域などを書いておくと、毎回同じ指示を繰り返さずに済む。

# AGENTS.md(例)
- パッケージ管理は pnpm を使う。npm/yarn は使わない
- 変更後は必ず `pnpm test` を通してからコミットする
- `src/legacy/` 配下は触らない
- コミットメッセージは Conventional Commits 形式で日本語

AGENTS.md の書き方とClaude Codeとの併用ワークフローをさらに深掘りしたい場合は、より詳細な Codex CLI 使い方ガイド|インストール・AGENTS.md書き方・Claude Code連携 もあわせて参照してほしい。本記事は2026年6月時点の最新仕様と他ツール比較を中心に据えている。

基本コマンド

日々の操作はそれほど多くない。よく使うものを押さえれば十分回る。

起動と対話

codex                        # TUIを起動して対話開始
codex "READMEを日本語に翻訳して"  # 最初の指示を渡して起動
codex --cd ./packages/api    # 作業ディレクトリを指定して起動
codex -m gpt-5.3-codex       # モデルを指定して起動

TUI内では、スラッシュコマンドで操作を切り替える。代表的なものは次の通りだ。

/model … 使用モデルを切り替える(GPT-5.5 / GPT-5.3-Codex など)
/approvals … 承認ポリシーを対話的に変更する
/mcp … 接続中のMCPサーバとツールを確認する
/review … 現在の差分を別エージェントにレビューさせる
/clear … 会話のコンテキストをリセットする

非対話実行(exec)

スクリプトやCIに組み込むなら codex exec を使う。結果を標準出力に返すため、パイプや後続処理とつなげやすい。

# 一発実行。結果を標準出力に返す
codex exec "全テストを実行し、失敗があれば原因を要約して"

# 承認なし・読み取り専用で安全に要約だけさせる
codex exec --sandbox read-only "このリポジトリの構成を3行で説明して"

# 完全自動(隔離環境向け。権限に注意)
codex exec --full-auto "lintエラーをすべて修正してコミットして"

セッションの再開と履歴検索

直近のバージョンでは、ローカルの会話履歴を横断検索できるようになった。前回の作業の続きを探して再開する、といった使い方ができる。長い調査タスクを分割して進めるときに効く。

codex resume        # 直近のセッションを選んで再開

実践Tips(コーディング自動化)

ここからは、実務で効くパターンを挙げる。いずれもサンドボックスと承認の設計が前提になる。

最小権限から始める:まず --sandbox read-only で調査・要約をさせ、変更を伴う作業だけ workspace-write に上げる。danger-full-access はDockerやCIの使い捨て環境に限定する
機密を環境から外すshell_environment_policy.exclude*_TOKEN *_SECRET を除外し、サンドボックス内のコマンドに鍵を渡さない。プロンプトインジェクション対策の基本になる
コミット前に /review を挟む:自分が出した差分を別エージェントにレビューさせると、見落としや余計な変更を機械的に拾える。人間レビューの前段に置くと効率が上がる
exec でCIに組み込むcodex exec --sandbox read-only を使えば、PRに対する自動要約・命名規約チェック・ドキュメント生成を安全に回せる。書き込みが要る作業のみ権限を上げる
model_reasoning_effort を使い分ける:定型作業は lowmedium、難しいリファクタリングや設計判断は highxhigh に上げる。コストと速度のバランスを指示単位で調整できる
画像で要件を渡す:UIバグはスクリーンショット、仕様はデザイン画像を添付すると、文章だけより再現性が上がる
MCPで社内ツールをつなぐ:チケット管理やドキュメント検索をMCPサーバ化すれば、Codexがコンテキストを自分で取りに行ける。属人化した手順の自動化に向く

具体的な流れも見ておこう。たとえば「失敗しているテストを直す」という典型タスクは、読み取り→修正→レビューの三段で安全に回せる。最初は調査だけ読み取り専用で行い、原因が見えてから書き込み権限を与えるのがコツだ。

# 1. まず読み取り専用で原因を特定させる
codex exec --sandbox read-only "失敗しているテストを列挙し、原因の仮説を3行で"

# 2. 書き込みを許可して修正させる(承認を挟む)
codex "上記のテストを修正して。変更は最小限に"

# 3. コミット前に別エージェントでレビュー
# TUI内で /review を実行 → 差分の問題点を洗い出す

この三段に分けると、AIに渡す権限を必要なタイミングまで遅らせられる。いきなり --full-auto で全部任せるより事故が起きにくく、レビューも差分単位で残るため、後から変更履歴を追いやすい。

ローカルLLMでCodex CLIを動かしたい場合は、API課金もレート制限もない構成も選べる。詳しくは Ollama 0.24でOpenAI Codex CLIがローカルLLMで動く を参照してほしい。

下図はCodex CLIが一つの指示を処理する流れを示したものだ。承認とサンドボックスが、自動化と安全性の両立点になっている。

flowchart TD A[自然言語で指示
codex / codex exec] --> B[コンテキスト収集
ファイル読み込み・Web検索・MCP] B --> C[計画立案
変更方針とコマンドを決める] C --> D{承認ポリシー
approval_policy} D -->|要承認| E[ユーザが差分・実行を承認] D -->|never / full-auto| F[サンドボックス内で実行] E --> F F --> G[結果を評価
テスト・ビルド出力を確認] G -->|未達| C G -->|完了| H[差分提案・コミット
/review でレビュー]

Claude Code / Cursor / Aider / Cline との比較

ターミナル型・IDE型を含め、主要なAIコーディングツールと並べて整理する。下表は2026年6月時点の公開情報に基づく。料金・対応モデルは変動が速いため、導入前に各公式で最新を確認してほしい。

項目 Codex CLI Claude Code Cursor Aider Cline
提供元 OpenAI Anthropic Anysphere コミュニティOSS コミュニティOSS
形態 ターミナルCLI ターミナルCLI AIネイティブIDE ターミナルCLI VS Code拡張
既定モデル GPT-5.5系 Claude Opus/Sonnet系 自前+各社モデル モデル非依存 モデル非依存
ライセンス Apache-2.0 独自(無償配布) プロプライエタリ Apache-2.0 Apache-2.0
課金軸 ChatGPTプラン or API Claudeプラン or API 月額サブスク モデルAPI実費 モデルAPI実費
IDE連携 VS Code/Cursor/Windsurf拡張 VS Code/JetBrains拡張 単体IDE なし(CLI単体) VS Code内で完結
サンドボックス あり(OS別・既定で遮断) あり(権限制御) 限定的 なし(git差分で担保) 承認制
MCP対応 対応 対応 対応 非対応 対応

選び方の指針はシンプルだ。普段の主力モデルに合わせるのが第一の基準になる。

ChatGPT中心の人 → Codex CLI。既存プランをそのまま使え、GPT-5.5系のコーディング性能を追加課金なしで引き出せる
Claude中心の人 → Claude Code。Opus/Sonnet系の強みと権限制御を活かせる。CodexとはモデルとUIの思想が近く、併用しやすい
IDEに統合したい人 → Cursor。エディタ体験と一体化したい、補完中心で使いたいならIDE型が向く
モデルを自由に選びたい人 → Aider / Cline。OSSでモデル非依存。コストを実費で抑えたい、ローカルLLMや特定APIに固定したい場合に強い

実際には「主力1つ+サブ1つ」を併用する開発者が多い。Codex CLIはApache-2.0で無料導入でき、ChatGPTプランがあれば追加コストゼロで試せるため、サブとして入れておく価値は高い。

料金プラン2026年版

Codexの料金は「ChatGPTプランに含める」方式と「APIキーで従量課金」方式の2系統がある。以下は2026年6月時点で公開されている主要プランの目安だ。レート上限・価格は頻繁に改定されるため、必ず公式の料金ページで最新を確認してほしい(数値は公表値の引用であり、将来の保証ではない)。

プラン 月額 ローカル実行の目安 主な対象
Free 0ドル ごく少量・お試し まず触ってみたい人
Go 8ドル 軽量タスク向け 個人の軽い用途
Plus 20ドル GPT-5.5で5時間あたり15〜80メッセージ 個人開発の主力
Pro 100ドル〜(5x / 20x) GPT-5.5で5時間あたり80〜1600メッセージ ヘビーユーザ
Business 従量(シート課金) より大きなクラウドVM チーム利用
Enterprise / Edu 個別見積 固定上限なし・クレジット制 組織導入

APIキー方式は、ChatGPTプランとは独立してトークン従量で課金される。コーディング最適化のGPT-5.3-Codexや軽量なGPT-5.4-miniは単価が低く、用途に応じて使い分けるとコストを抑えられる。次の使い分けが基本になる。

個人で日常的に使う:Plus(月20ドル)が出発点。上限に当たるならPro
チームで共有・管理したい:BusinessやEnterpriseでシート管理とクラウドVMを使う
CI/自動化で大量に回す:APIキー方式で従量課金。安価なモデルに寄せて単価を下げる

エンタープライズ用途

組織導入では、安全性とガバナンスが論点になる。Codexはこの領域の機能を継続的に拡張している。2026年6月時点で押さえておきたいのは次の点だ。

SSOと組織管理:Business / Enterpriseプランでシート管理・利用状況の可視化に対応。エンタープライズ向けには月次のクレジット上限表示なども追加されている
クラウド管理の設定配布:管理者が設定バンドルを配布し、ユーザ・プロジェクト・セッションのフックを制御できる。requirements.tomlallow_managed_hooks_only = true を設定すると、管理外のフックを無視させられる
Amazon Bedrock連携:Bedrockのモデルプロバイダ設定により、AWS側の認証・アカウント制御・課金に乗せて利用できる。既存のクラウドガバナンスに統合しやすい
データポリシー:APIキー方式とエンタープライズ契約では、入力データの学習利用に関する扱いが個人プランと異なる。社内データを扱う場合は契約上のデータ取り扱い条項を必ず確認する
サンドボックスの強制:組織配布の設定でサンドボックスや承認ポリシーを既定値として固定し、danger-full-access を禁止するといった統制が可能

機微なコードを扱う現場では、「最小権限のサンドボックス+機密環境変数の除外+承認の必須化」を組織既定として配るのが現実的な落とし所になる。

よくある落とし穴

導入後につまずきやすいポイントを挙げる。多くは権限と認証まわりだ。

旧Codex(2021年のAPIモデル)と混同する:現行はCLI/エージェント製品。古い記事のAPI手順はそのままでは通用しない
danger-full-access を常用してしまう:承認なしの全権限は便利だが事故のもと。隔離環境以外では使わない
機密環境変数を渡したまま実行するexclude 設定を入れないと、トークン類がサンドボックス内のコマンドに渡る。プロンプトインジェクションで漏れるリスクがある
レート上限に当たって止まる:Plusの5時間ウィンドウ上限は意外に早く到達する。重い作業はモデルや権限を見直し、必要ならProやAPI方式へ
バージョンが古いまま使う:更新頻度が高く、機能やフラグが追加・整理される。codex --version を時々確認し、codex doctor で環境診断を回す
自動コミットを鵜呑みにする--full-auto での自動コミットは、差分レビューを必ず人間が通す前提で使う。/review を前段に挟むと安全

なお、Codex CLIの認証情報を狙ったサプライチェーン攻撃(偽パッケージ)も実際に観測されている。インストール時はパッケージ名のタイポに注意し、公式の配布元から導入することを徹底したい。

FAQ

Q. Codex CLIはオフラインで使えますか? A. 既定のクラウドモデルを使う限り、推論にはネットワーク接続が必要です。ただしOllamaなどローカルLLMと組み合わせる構成なら、API課金もレート制限もなくローカルで動かせます。

Q. 日本語で指示しても問題ありませんか? A. 問題ありません。GPT-5.5系は日本語の指示・コメント生成に対応します。コードのコメントやコミットメッセージも日本語で出力させられます。

Q. 既存のVS Code環境とどう併用しますか? A. VS Code / Cursor / Windsurf向けのIDE拡張が提供されています。CLIで重い自動化を回し、エディタ内では拡張で軽い編集を行う、といった併用が一般的です。

Q. Codex CLIとClaude Code、両方入れても大丈夫ですか? A. 大丈夫です。それぞれ別のプラン・モデルで動くため衝突しません。普段使うモデルに合わせて主力を決め、もう一方をサブにする使い方が現実的です。

Q. チームで使うとき、メンバーごとに設定をそろえられますか? A. プロジェクト直下の .codex/config.toml をリポジトリに含めれば、モデル・サンドボックス・承認ポリシーをチームで共有できます。組織配布の設定バンドルを使えばさらに強く統制できます。

Q. 生成コードの著作権・データ利用はどうなりますか? A. 個人プランとAPI/エンタープライズ契約で、入力データの学習利用に関する扱いが異なります。社内コードを扱う場合は、利用するプランのデータ取り扱い条項を事前に確認してください。

Q. どのくらいの頻度で更新されますか? A. 非常に高頻度です。2026年6月時点で 0.137.0 系が出ており、数日単位で機能追加・修正が入ります。新機能やフラグの追加が多いため、定期的な更新を推奨します。

参照ソース

・OpenAI Developers — Codex CLI ドキュメント: https://developers.openai.com/codex/cli/
・OpenAI Developers — Codex 設定リファレンス: https://developers.openai.com/codex/config-reference
・OpenAI Developers — Codex Changelog: https://developers.openai.com/codex/changelog
・GitHub — openai/codex リポジトリ: https://github.com/openai/codex