この記事ではClaude Sonnet 5(モデルID:claude-sonnet-5)を、モデル選定と移行の観点から一次ソースで解説します。Claude APIの料金全般は Claude 料金まとめ|Claude Code・API・Opus 4.7の価格を計算シミュレーター付きで比較 をご覧ください。

2026年6月30日、AnthropicはClaude Sonnet 5を正式リリースした。位置づけは明快で、公式は「最もエージェント的なSonnetモデル」と表現し、性能はOpus 4.8に迫りながら価格はSonnetのままだとしている。ミッドレンジのモデルが、少し前なら上位モデルでしか到達できなかった自律性を、桁違いに安い価格で提供する――これがSonnet 5の核心だ。

Claude Sonnet 5の要点:導入価格$2/1M入力、モデルID claude-sonnet-5、適応的思考デフォルトON、1M文脈・128k出力、入力単価の比較
Claude Sonnet 5の要点(図:AI Heartland/数値はAnthropic公式・一次ソースに準拠)
この記事のベンチマーク方針:Anthropicは公式ブログで比較チャートを掲載しているが、本文中に取り出せる確定数値としては公開していない(詳細は Transparency Hub に集約)。そのため本記事では、確認できない具体スコアは数値として載せない。載せるのはモデルID・料金・コンテキスト長・API仕様など、公式ドキュメントで確認できる一次情報のみとする。

Claude Sonnet 5とは何か――Opus 4.8級の性能をSonnet価格で

Claude Sonnet 5は、AnthropicのSonnetファミリーの次世代モデルだ。読者がまず知りたい「①何ができるのか/②何を解決するのか/③何を代替するのか」に、公式情報だけで答えると次のようになる。

①何ができるのか。 計画を立て、ブラウザやターミナルといったツールを使い、自律的にタスクを進める――いわゆる「エージェント」としての振る舞いだ。Anthropicはこれを「最もエージェント的なSonnet」と表現し、少し前なら大型で高価なモデルでしか成立しなかった水準の自律実行が、Sonnetの価格帯で回せるようになったとしている。

②何を解決するのか。 「品質は欲しいが、Opusを全リクエストに使うとコストが重い」というジレンマだ。Sonnet 5は前世代のSonnet 4.6に対し、推論・ツール操作・コーディング・知識作業といったエージェント性能の要所で大きく改善している。つまり、これまでOpusに逃がしていた作業の一部を、Sonnetの価格のまま巻き取れる。

③何を代替するのか。 直接の代替は前世代のSonnet 4.6であり、モデルIDを差し替えるだけのドロップイン更新になる。加えて、コーディング・エージェント用途では上位のOpusに近い品質を安価に得られるため、「とりあえずOpus」だった構成の一部をSonnet 5に置き換える判断が現実的になる。

具体的には、たとえば「大量のPull Requestを自動レビューする」「Issueを起点にコードを直してテストを通す」「社内ドキュメントを横断して回答する」といった、これまで品質を理由にOpusへ寄せていた反復タスクが乗り換え候補になる。1リクエストあたりの単価差は小さく見えても、エージェントは1つのタスクを完了するまでにモデルを何十回も呼ぶため、積み上がると差は大きい。Sonnet 5がOpusに迫る品質を出す限り、こうした高頻度・多コールのワークロードほど乗り換えメリットが効く。逆に、単発のチャット応答のような低頻度の使い方では、コスト差は体感しにくい。

Sonnet 5がSonnet 4.6から強化した領域:計画立案・ツール操作・自律実行・コーディング・知識作業
Sonnet 5がSonnet 4.6から強化した領域(図:AI Heartland/表現はAnthropic公式の記述に準拠)

提供範囲も広い。ChatのFree・Proプランではデフォルトモデルとして採用され、Max・Team・Enterpriseでも利用できる。開発者向けにはClaude Code、そしてClaude API経由で claude-sonnet-5 を指定して使える。クラウド各社(Amazon Bedrock/Claude Platform on AWS、Google Cloud、Microsoft Foundry)でも提供される。なお、Priority TierだけはSonnet 5では利用できない点は覚えておきたい。

補足:モデルIDに日付は付かない。 正しい文字列は claude-sonnet-5 の1つだけだ。claude-sonnet-5-20260401 のような日付入りIDは存在せず、指定すると404になる。事前に出回っていた「日付付きID」は誤りなので、コードや設定ファイルに残っていないか確認しておきたい。

何が新しいのか――エージェント性能とモデルID claude-sonnet-5

Sonnet 5の新しさは、大きく2軸に分けられる。能力面の伸びと、API挙動の変更だ。まず能力面から見る。

能力面での最大の伸びは、公式によればコーディングとエージェント作業にある。具体的な強化領域は次のとおり。

・計画立案:複数ステップのタスクを自分で分解し、順序立てて進める
・ツール操作:ブラウザやターミナルなどのツールを状況に応じて呼ぶ
・自律実行:人間の逐次指示なしで、まとまった作業を最後まで走らせる
・コーディング:バグ修正・実装・レビューでSonnet 4.6を大きく上回る
・知識作業:ドキュメント・表計算・分析といった実務系タスクの精度向上

これらは「見出しに数字を並べる」タイプの強化ではなく、実務でエージェントを走らせたときの完走率・破綻の少なさとして効いてくる性質のものだ。当サイトの読者が気にするであろう「結局、業務で使えるのか」に対しては、Anthropicが自社のChat既定モデルにSonnet 5を据えたこと自体が、実運用に耐えるという判断の表れと読める。

API挙動の変更は独立したテーマなので、後半の「移行」セクションでまとめて扱う。ここでは、新しいのは能力だけではなく、既存コードに影響しうる挙動変更も含むという事実だけ押さえておけばよい。

注意:「Fennec」などの事前リーク・開発コードネームは、Anthropicの公式リリース資料には登場しない。一部の事前情報は、のちにSonnet 4.6として出たものと混同されていた形跡もある。公式launch前の非公式スペック・コードネームは未確認情報として扱い、この記事では確定情報だけを根拠にしている。

Sonnet 5 vs Sonnet 4.6 vs Opus 4.8――性能と料金の比較

3モデルの役割分担を、確認できる一次情報だけで整理する。数値はすべて公式ドキュメント(Models overview/What’s new)に基づく。

モデル 入力(/100万トークン) 出力(/100万トークン) コンテキスト 最大出力 位置づけ
Claude Sonnet 5 $3(〜8/31 導入 $2) $15(〜8/31 導入 $10) 1M 128k コーディング・エージェントの新既定
Claude Sonnet 4.6 $3 $15 1M 128k 互換継続・動作実績重視
Claude Opus 4.8 $5 $25 1M 128k 最高難度・最上位品質
Claude Haiku 4.5 $1 $5 200k 64k 高速・大量・低コスト

ポイントは3つ。(1)Sonnet 5とSonnet 4.6は同額で、性能だけがSonnet 5で上がっている。(2)Opus 4.8との価格差は入力で約1.6倍・出力で約1.6倍あり、Sonnet 5がOpusに迫るなら、多くのワークロードでコスト効率が跳ね上がる。(3)文脈は全ティア1M(Haikuのみ200k)で、Sonnet 5の1Mは「小さい版」が存在しない――つまり常に1M文脈が使える。

この価格差は、単発のチャットでは誤差でも、エージェント運用ではボディブローのように効いてくる。1つのタスクを完了するまでにモデルを数十回呼ぶ構成では、入出力トークンが積み上がり、Opusとの約1.6倍差がそのまま月次コストの差として表れる。Sonnet 5の狙いはここにあり、「品質を理由にOpusへ逃がしていた高頻度ワークロードを、大きく品質を落とさずSonnet価格へ引き戻す」ことにある。だからこそ、モデル選定は『1回の呼び出しの単価』ではなく『1タスクあたりの総コスト×品質』で見るのが正しい。

モデル選定の直感を掴むために、価格帯と役割を図にすると次のようになる。

graph TD subgraph opus["Opusティア — $5/$25・1M文脈"] O["Claude Opus 4.8
最高難度の長時間エージェント
知識作業・メモリ"] end subgraph sonnet["Sonnetティア — $3/$15(導入$2/$10)・1M文脈"] S5["Claude Sonnet 5 ← NEW
Opus 4.8に迫る品質
コーディング・エージェントの新既定"] S46["Claude Sonnet 4.6
同額だが性能は下
互換継続用"] end subgraph haiku["Haikuティア — $1/$5・200k文脈"] H["Claude Haiku 4.5
高速・大量・低コスト"] end S5 -.->|"品質でOpus 4.8に接近"| O S46 -->|"モデルID差し替えで更新"| S5

用途別に落とし込むと、当面の推奨はこうなる。

・コード生成・バグ修正・コードレビュー:Sonnet 5(Opusに迫る品質を安価に)
・ブラウザ/ターミナル操作を伴うエージェント:Sonnet 5(最もエージェント的なSonnet)
・大量・高速・単純な分類やチャット:Haiku 4.5(コスト効率が最大)
・最高難度の長時間・自律タスク、最上位品質が必須の場面:Opus 4.8
・既存のSonnet 4.6依存システムで挙動を固定したい場合のみ:Sonnet 4.6

なお、Anthropicは公式ブログでSonnet 5・Sonnet 4.6・Opus各モデルの比較チャートを掲載しているが、本文から取り出せる確定スコアの形では公開していない。具体的なベンチマーク数値が必要な場合は、Anthropicの Transparency Hub を一次ソースとして確認してほしい。本記事で確認できない数字を断定的に載せないのは、そのためだ。

料金と新トークナイザ――「同額$3/$15」でも実コストは変わる

Sonnet 5の料金設計には、見出しだけ読むと見落とす罠がある。単価はSonnet 4.6と同じでも、実際の請求は変わりうるという点だ。

まず単価を確認する。

期間 入力(/100万トークン) 出力(/100万トークン)
導入価格(〜2026年8月31日) $2 $10
標準価格(2026年9月1日〜) $3 $15

標準の$3/$15はSonnet 4.6と完全に同額だ。にもかかわらず「実コストは変わりうる」のは、Sonnet 5が新しいトークナイザを採用したからだ。公式は次のように明言している。

新トークナイザで、同一テキストのトークン数が約30%増える。これはAPIの形(リクエスト/レスポンス/ストリーミング)を変えるものではなく、コード変更は不要。だが「トークンで測る・見積もるもの」すべてに影響する。同じ文章でも usage のトークン数が増え、1Mの文脈に入る「文章量」は実質減り、Sonnet 4.6基準で調整した max_tokens は同等出力で途中打ち切りになりうる。

つまり、単価が同じでも「同じ処理にかかるトークン数」が増えるため、1リクエストあたりのコストはSonnet 4.6と違ってくる。増加幅は内容やワークロードの形に依存するため、一律の係数で掛け算するのは危険だ。移行時にやるべきことは1つ――代表的なプロンプトを count_tokens(トークンカウントAPI)で claude-sonnet-5 に対して測り直し、実測でコストと max_tokens を再調整することだ。

具体例で考えると分かりやすい。Sonnet 4.6で1万トークンだったプロンプトは、同じ文章でもSonnet 5ではおおむね1.3万トークン前後になりうる(増加幅は内容次第)。すると、(a)入力コストは単価が同じでもトークン増分だけ上がり、(b)1Mの文脈に収まる「実際の文章量」は目減りし、(c)出力側の max_tokens を4.6時代のまま使うと、同等の応答が途中で切れることがある。移行時のチェックは次の3点に集約される。

・入力:代表的なプロンプトを claude-sonnet-5 に対して count_tokens で測り直し、増分を実測してコスト表を更新する
・文脈:長文を丸ごと渡す設計なら、1M枠に収まるかをトークン基準で再確認する(文字数基準で見積もると溢れる)
・出力:max_tokens を出力想定に近い値で切っている箇所は、余裕を持たせて途中打ち切り(stop_reason:"max_tokens")を防ぐ

この「同額に見えて実は据え置きではない」構造は、複数の海外メディアも指摘している。料金表の数字だけを比較して「値上げなし」と結論づけると、実運用の請求額を読み違える。単価×想定トークン数の両方を、Sonnet 5基準で見直すのが正しい。

Sonnet 4.6からの移行――「モデルID変更+3つの挙動変更」

Sonnet 5はSonnet 4.6のドロップイン置き換えだ。多くのコードはモデルID文字列を変えるだけで動く。ただし公式が明記する3つの挙動変更に該当するコードは、そのままだと 400 エラーになる。ここが移行の肝だ。

Sonnet 4.6からSonnet 5への移行:非既定サンプリング・budget_tokens・prefillは400になる書き方、正しい書き方の対比
移行時の「400になる書き方」と「正しい書き方」(図:AI Heartland/内容はAnthropic公式のWhat's new / 移行ガイドに準拠)

3つの挙動変更を、影響と対処で整理する。

変更点 Sonnet 4.6での挙動 Sonnet 5での挙動 対処
適応的思考(adaptive thinking) thinking未指定で思考OFF thinking未指定で思考ON 思考を切りたいなら thinking:{type:"disabled"}max_tokensに思考分の余裕を確保
手動の拡張思考(budget_tokens 非推奨だが動作 400エラー thinking:{type:"adaptive"}effort に置換
サンプリング指定 temperature等を指定可 非既定値は400エラー 指定を削除(既定・省略はOK)。挙動はシステムプロンプトで誘導

さらに、assistantメッセージのprefill(先頭の書き出しを固定する手法)はSonnet 4.6から引き続き非対応(400)だ。出力形式を固定したいなら、prefillではなく構造化出力(output_config.format)やシステムプロンプトで代替する。

適応的思考が既定でONになった点は特に見落としやすい。max_tokens は「思考+応答テキストの合計」に対する上限なので、Sonnet 4.6で思考OFFのまま回していたワークロードは、Sonnet 5だと思考分を食って応答が途中で切れることがある。思考を使わないつもりなら明示的に disabled にするか、max_tokens を増やす

移行時の分岐を1枚にすると、こう進めればよい。

flowchart TD A["Sonnet 4.6で動いているコード"] --> B{"budget_tokens や
temperature/top_p/top_k を
指定している?"} B -->|"いいえ"| C["モデルIDを claude-sonnet-5 に
変えるだけで動く"] B -->|"はい"| D["thinking:adaptive に置換し
非既定サンプリング指定を削除"] D --> C C --> E{"トークン量に依存する上限
(max_tokens・課金見積)がある?"} E -->|"はい"| F["新トークナイザで約+30%。
count_tokensで再計測し調整"] E -->|"いいえ"| G["移行完了"] F --> G

コードで示すと、移行の本質は次の1ブロックに集約される。モデルIDを差し替え、思考は適応的思考に、サンプリング指定は外す――これだけだ。

import anthropic

client = anthropic.Anthropic()  # ANTHROPIC_API_KEY は環境変数で

msg = client.messages.create(
    model="claude-sonnet-5",          # 旧: "claude-sonnet-4-6"
    max_tokens=4096,                  # 思考ON分の余裕を見て設定
    thinking={"type": "adaptive"},    # 4.6は省略で思考OFF/5は既定でON
    # temperature / top_p / top_k は指定しない(非既定値は400)
    # budget_tokens も指定しない(400)。深さは output_config.effort で調整
    messages=[{"role": "user", "content": "このリポジトリのバグを直して"}],
)
print(msg.content[0].text)

自動化ワークフローで運用している場合も考え方は同じだ。Claude Code Auto Modeのような自動化構成でSonnetを使っているなら、設定ファイルやCI/CDの環境変数でモデルIDを claude-sonnet-5 に書き換え、上の3点をチェックすればよい。応答形式・ツール定義(function calling)・ストリーミングのインターフェースは変わらないため、移行そのものは小さい。

開発者が注目すべき点――適応的思考・エフォート・サイバー安全対策

移行の先で、Sonnet 5を「使いこなす」ために押さえておきたい仕様を機能単位でまとめる。

機能 内容 実務での意味
適応的思考(adaptive thinking) タスクの複雑さに応じてモデルが思考量を自動調整。既定でON budget_tokensを手で調整する時代は終わり。深さはeffortで制御
エフォート(effort low/medium/high/xhigh/max を選択可。Sonnet系で初めてxhighに対応 難しいコーディング・エージェントはxhigh、軽い処理はlowでコスト最適化
高解像度ビジョン 長辺2576pxまでの画像を高解像度で処理 スクショ・図面・ドキュメント読み取りの精度向上(コンピュータ操作にも有利)
サイバー安全対策 Sonnet系で初のリアルタイム・サイバーセーフガード 高リスクなサイバー系リクエストは拒否されることがある(下記)

とくにエフォート(effort)はSonnet 5での主要なコスト・品質レバーだ。effort を上げるほど思考とツール使用が増え、下げるほど手数が減って安く・速くなる。目安としては、日常的な作業は既定の high、難しいコーディングやエージェントタスクは xhigh、レイテンシ重視の軽い処理は low から始めるとよい。lowmedium では「指示された範囲を厳密に」こなす傾向が強くなるため、複雑な問題で思考が浅いと感じたら、プロンプトで粘るより先に effort を上げるのが定石だ。

サイバー安全対策は挙動として知っておく必要がある。Sonnet 5はSonnet系で初めてリアルタイムのサイバーセーフガードを備え、禁止・高リスクなサイバーセキュリティ関連のリクエストは拒否されることがある。重要なのは、この拒否がエラーではなくHTTP 200成功レスポンスとして返り、stop_reason"refusal" になる点だ。response.content を無条件に読むコードは、拒否時にインデックスエラーを起こしうる。セキュリティ系のツールを作るなら、stop_reason を先に確認する分岐を入れておきたい。なお公式は、Sonnet 5がSonnet 4.6より望ましくない振る舞いの発生率が全体的に低く、エージェント用途で総じて安全だとしている一方、現行Opus系よりサイバータスクの能力は大幅に低いとも明記している。

提供面の細かい注意も挙げておく。Sonnet 5はClaude APIのほか、Amazon Bedrock/Claude Platform on AWS、Google Cloud、Microsoft Foundryでも利用できる。ゼロデータ保持(ZDR)契約のある組織でも使える一方、レガシーBedrock(InvokeModelConverse API)とPriority Tierではサポートされない。コンピュータ操作(画面のスクリーンショットを渡す用途)では、公式は高解像度対応(長辺2576px)を備えつつ、実運用ではスクショを1080p程度で送るのが性能とコストのバランスが良いとしている。高解像度は精度に効くが、画像トークンが増えるためだ。

エージェント・Claude Codeとの相性も良い。Claude CodeやOpenHandsのようなAIコーディングエージェントのバックエンドをSonnet 5にすれば、バグ修正・PR作成・テスト実行といった多段の自動化を、Opusより安いコストで回せる。これはまさにAnthropicが「Sonnet 5=エージェントを安く回す手段」と位置づけている使い方そのものだ。効率をさらに詰めたいなら、effort を用途ごとにチューニングし、思考が不要な軽い工程は low、精度が要る工程は xhigh と使い分けるとよい。

まとめと現時点での注意点――何ができて何を代替するのか

最後に、読者の3問へ一次情報だけで答える形でまとめる。

問い Sonnet 5の答え(一次ソース準拠)
結局、何ができる? 計画・ツール操作・自律実行を含む「最もエージェント的なSonnet」。コーディング・エージェント作業で前世代を大きく更新
何を解決する? 「品質は欲しいがOpusは高い」ジレンマ。Opus 4.8に迫る品質を$3/$15(導入$2/$10)で提供
何を代替する? 直接はSonnet 4.6(ドロップイン更新)。コーディング・エージェント用途では“とりあえずOpus”構成の一部も代替

導入判断はシンプルだ。新規開発はSonnet 5から始めるのが妥当で、既存のSonnet 4.6アプリは前述の3挙動変更をチェックしてモデルIDを差し替える。Opus 4.8は「最高難度・最上位品質が必要な場面のためのオプション」として残す、という切り分けになる。

一方で、現時点で明確にしておくべき未確認・要注意ポイントもある。

公式ベンチ数値:Anthropicは比較チャートを公開しているが、本文から取り出せる確定スコアの形では出していない。具体値が要るならTransparency Hubを一次ソースとして確認する。第三者メディアが出す「SWE-bench ◯%」等の数字は、出典と測定条件を必ず確かめる
事前リーク・コードネーム:公式launch前に出回った非公式スペックやコードネームは、公式資料に登場しないものが多く、一部はSonnet 4.6と混同されていた。未確認情報として扱う
トークナイザ差:新トークナイザで同一テキストが約30%増える。単価が同じでも実コスト・max_tokens・文脈の実効容量が変わるため、count_tokensで必ず再計測する
サイバーセーフガードstop_reason:"refusal"(HTTP 200)が返る場面がある。セキュリティ隣接の正当な作業でも稀に誤検知しうるので、拒否ハンドリングを実装しておく

要するにSonnet 5は、「Opusに迫る品質を安く」という一点で選ぶ価値がある一方、料金の見え方(同額でも実コストは別)移行時の3挙動変更という2つの落とし穴がある。この2点さえ押さえれば、コーディングとエージェントの新しい既定モデルとして、コスト効率を大きく引き上げられる。

参照ソース


この記事はAI業界の最新動向を速報でお届けする「AI Heartland ニュース」です。