この記事ではLLMに特化して解説します。LLM全般は LLMとは?仕組みからローカル実行まで徹底解説【2026年完全ガイド】 をご覧ください。
Qwen 3.6 Plusが樹立した「1日1.4兆トークン」の衝撃
OpenRouterが2026年4月4日に発表した数字は、LLM業界の勢力図を書き換えるものだった。
Qwen 3.6 Plus は、OpenRouter上で1日に1兆トークンを処理した最初のモデルになった。約1,400,000,000,000トークン——2026年にリリースされたモデルの中で、最も強力な初日パフォーマンスだ。
AlibabaのQwenチームが開発したこのモデルは、リリース初日から40万件のリクエストを処理し、4億以上の完了トークンを生成した。
リリース"] --> B["初日40万リクエスト"] B --> C["1.4兆トークン処理"] C --> D["OpenRouter史上
最大の1日処理量"]
Qwen 3.6の位置づけと前世代モデルとの差分
「qwen 3.6」で情報を探している読者がまず押さえたいのは、「Qwen 3.6がQwenファミリーのどこに位置するモデルで、3.5世代と何が変わったのか」という点だ。Qwen 3.6はAlibaba Cloud(Tongyi Lab)が2026年3月31日にプレビュー公開、4月2日に正式リリースしたフラグシップLLMで、Qwen 3ファミリーの最新世代にあたる。リリース初日でOpenRouter上1日1.4兆トークンという過去最大の処理量を達成した点が特徴的だ。
Qwen 3.6は単一のモデルを指す名称ではなく、フラグシップAPIの Qwen 3.6 Plus(本記事の主題)と、オープンソース版の Qwen 3 Dense / MoE(Apache 2.0ライセンス)の2系統で構成されている。Qwen 3.6 Plusはクローズドソースで、Alibaba BailianとOpenRouter経由で利用する。
前世代 Qwen 3.5 Plus との主な差分を整理する。
| 差分項目 | Qwen 3.5 Plus | Qwen 3.6 Plus | インパクト |
|---|---|---|---|
| コンテキスト長 | 128Kトークン | 100万トークン(約2,000ページ) | 長文ドキュメント一括処理が現実的に |
| 推論方式 | オプションCoT | 常時Chain-of-Thought | 毎クエリで段階的推論が効く |
| 過剰思考問題 | 発生あり | 修正済み | トークン浪費・応答遅延が軽減 |
| マルチステップ信頼性 | 中程度 | 大幅改善 | エージェントワークフローで差が出る |
| 関数呼び出し | 基本サポート | ネイティブ関数呼び出し | ツール利用の成功率向上 |
| アーキテクチャ | Dense中心 | Hybrid(Linear Attention + Sparse MoE) | 速度と長文処理の両立 |
特に100万トークンのコンテキストウィンドウとネイティブFunction Callingの2点が3.6世代の実用的な価値を決めている。長文ドキュメント(法務契約・研究論文・大規模コードベース)の一括解析が1APIコールで完結し、Claude Opus 4.6比で入出力コスト約14分の1という料金優位性と組み合わさる。Qwenチームが公式ブログで「Towards Real World Agents」と掲げているとおり、3.6世代はエージェント利用を第一想定としたモデルである。
LLMベンチマーク比較――Qwen 3.6 Plus vs Claude vs GPT
Qwen 3.6 Plusのベンチマーク結果は、用途によってClaude Opus 4.6やGPT-5.4と互角以上の性能を示している。
| ベンチマーク | Qwen 3.6 Plus | Claude Opus 4.6 | GPT-5.4 | 概要 |
|---|---|---|---|---|
| SWE-bench Verified | 78.8% | 80.9% | 57.7% | ソフトウェア工学タスク |
| Terminal-Bench 2.0 | 61.6% | 59.3% | — | ターミナル操作 |
| OmniDocBench v1.5 | 91.2% | 87.7% | — | ドキュメント理解 |
| RealWorldQA | 85.4% | 77.0% | — | 実世界の質問応答 |
SWE-benchではClaude Opus 4.6がリードするが、ターミナル操作・ドキュメント理解・実世界QAではQwen 3.6 Plusが上回る。特にRealWorldQAでの8ポイント以上の差は注目に値する。
推論速度の優位性
コミュニティの報告によると、Qwen 3.6 PlusはClaude Opus 4.6と比較してより高速な推論を実現している。結論に到達するまでのトークン消費量も少なく、判断が「より決断力がある」と評価されている。
Qwen 3.6 Plusの技術仕様
# Qwen 3.6 Plus 主要スペック
name: Qwen3.6-Plus
developer: Alibaba Cloud / Tongyi Lab
release: 2026-03-31 (preview), 2026-04-02 (official)
context_window: 1,000,000 tokens # 100万トークン
max_output: 65,536 tokens
architecture: Hybrid (Linear Attention + Sparse MoE)
reasoning: Always-on Chain-of-Thought # 常時有効
tool_use: Native function calling
parameters: Not disclosed # 非公開
license: Proprietary (closed source)
前バージョンからの改善点
Qwen 3.5 Plusからの主な改善点は以下の通り。
| 項目 | Qwen 3.5 Plus | Qwen 3.6 Plus |
|---|---|---|
| コンテキスト | 128Kトークン | 100万トークン |
| 推論 | オプション | 常時有効CoT |
| 「過剰思考」問題 | あり | 修正済み |
| マルチステップ信頼性 | 中程度 | 大幅改善 |
| エージェント性能 | 基本的 | ネイティブ対応 |
Qwen 3.6 Plusの料金比較――LLM APIコスト
Qwen 3.6 Plusの最大の武器はコストパフォーマンスだ。
| モデル | 入力(/100万トークン) | 出力(/100万トークン) | コスト比 |
|---|---|---|---|
| Qwen 3.6 Plus | $0(プレビュー) | $0(プレビュー) | 無料 |
| Qwen 3.6 Plus(Bailian) | $0.29 | $1.71 | 1x |
| GPT-5.4 | $2.50 | $15.00 | 8.6x |
| Claude Opus 4.6 | $5.00 | $25.00 | 14.6x |
Alibaba Bailianでの正規料金でも、Claude Opus 4.6の約14分の1。現在のOpenRouterプレビューなら完全無料で試せる。
エージェント機能――「Towards Real World Agents」
Qwen 3.6 Plusの公式ブログタイトルは「Towards Real World Agents」。エージェント用途に特化した設計が特徴だ。
タスク分解"] B --> C["コード生成・テスト"] B --> D["ドキュメント分析
(100万トークン)"] B --> E["ツール呼び出し
(Function Calling)"] C --> F["反復デバッグ"] D --> F E --> F F --> G["結果統合・出力"]
主なエージェント機能は以下の通り。
# Qwen 3.6 Plus のFunction Calling例(OpenRouter経由)
import openai
client = openai.OpenAI(
base_url="https://openrouter.ai/api/v1",
api_key="YOUR_OPENROUTER_KEY",
)
response = client.chat.completions.create(
model="qwen/qwen3.6-plus-preview",
messages=[
{"role": "user", "content": "このPRのコードレビューをして"}
],
tools=[{
"type": "function",
"function": {
"name": "read_file",
"description": "ファイルの内容を読む",
"parameters": {
"type": "object",
"properties": {
"path": {"type": "string"}
},
"required": ["path"]
}
}
}],
)
- エージェントコーディング: 複雑なプログラミングタスクを分解し、コード生成→テスト→デバッグを反復実行
- フロントエンド生成: スクリーンショットやデザインドラフトからWebページを自動生成
- 長文ドキュメント推論: 100万トークンのコンテキストで約2,000ページを一度に処理可能
利用方法――OpenRouterで今すぐ無料で試す
# curlで直接試す
curl https://openrouter.ai/api/v1/chat/completions \
-H "Authorization: Bearer $OPENROUTER_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "qwen/qwen3.6-plus-preview",
"messages": [{"role": "user", "content": "Hello, Qwen 3.6 Plus!"}]
}'
# 無料版エンドポイント
# model: "qwen/qwen3.6-plus-preview:free"
OpenRouterでのモデルID:
- プレビュー版:
qwen/qwen3.6-plus-preview - 無料版:
qwen/qwen3.6-plus-preview:free
注意: OpenRouterの記載によると、「プロンプトと完了データはモデル改善に使用される可能性がある」とのこと。機密データの入力は避けるべきだ。
オープンソース版との位置づけ
Qwen 3.6 Plus自体はクローズドソースだが、Qwen 3ファミリーの他のモデルはApache 2.0ライセンスでオープンソース公開されている。
| モデル | ライセンス | 用途 |
|---|---|---|
| Qwen 3.6 Plus | クローズド | フラグシップAPI |
| Qwen 3 Dense (0.6B〜32B) | Apache 2.0 | ローカル実行 |
| Qwen 3 MoE (30B/235B) | Apache 2.0 | 高性能ローカル |
vLLMなどのローカル実行環境でオープンソース版を使いつつ、高性能が必要な場面でQwen 3.6 Plus APIを使い分ける戦略が現実的だ。
Qwen 3.6を実運用で使うときに踏みやすい3つの落とし穴
ベンチマーク値だけ見ると「Claudeより安くて速い」と即決しがちだが、Qwen 3.6 Plusを実プロダクトに入れるときに事前確認すべき制約を挙げる。日本企業の検討時に頻出する論点だ。
| 落とし穴 | 具体的な制約 | 回避策 |
|---|---|---|
| データ収集ポリシー | OpenRouterプレビュー版は入出力データがモデル学習に再利用される可能性あり | 機密データは Alibaba Bailian の正規API(学習利用なしオプション)か、オープンソース版 Qwen 3 Dense をローカル運用 |
| レート制限の急変 | 無料プレビュー期間終了で従量課金へ自動移行する可能性 | コスト上限を OpenRouter の Limits で必ず設定(max_tokens の事前指定も必須) |
| 日本語の語彙バイアス | 中国語LLMベース。固有名詞・敬語・業界専門用語で英語直訳的な表現が出やすい | システムプロンプトで「日本のビジネス文書として自然な敬語」を明示 |
特にデータ収集ポリシーは契約・法務部門が必ず止めるポイント。「OpenRouter経由のQwenはデータが学習利用される」という事実を読み飛ばさないことが重要だ。Claude APIやBedrock経由のClaudeはデータ学習利用なしが標準だが、Qwenはエンドポイントで挙動が変わる。
Qwen 3.6 vs Claude vs GPT — タスク別の使い分け早見表
ベンチマークだけでなく、料金・データ取り扱い・日本語精度・推論速度の4軸で「タスク別に最適なモデル」を整理した。
| タスク | 第一候補 | 第二候補 | 理由 |
|---|---|---|---|
| 大量バッチのテキスト分類 | Qwen 3.6 Plus | GPT-5.4 mini | コスト効率最優先 |
| 本番アプリのコード生成 | Claude Opus 4.6 | GPT-5.4 | SWE-bench 80.9%・Anthropic API成熟 |
| 100万トークン超の長文処理 | Qwen 3.6 Plus | Gemini 2.5 Pro | 1Mコンテキスト・料金優位 |
| 日本語の社内文書要約 | Claude Sonnet 4.6 | GPT-5.4 | 敬語・固有名詞の精度 |
| エージェントの並列推論 | Qwen 3.6 Plus | Claude Sonnet 4.6 | Function Callingネイティブ・低レイテンシ |
| 機密情報を含む業務 | Claude(Bedrock) | Azure OpenAI | データ学習利用なし保証 |
結論: Qwen 3.6 は「コスト優位」「長文」「並列エージェント」で第一候補、機密性・日本語自然性・コーディング精度ではClaudeを優先するのが2026年5月時点の現実解だ。
で、結局Qwen 3.6 Plusは使うべきか
を検討"] --> B{"コスト重視?"} B -->|"Yes"| C["Qwen 3.6 Plus
Claude比14分の1"] B -->|"No"| D{"コーディング
精度重視?"} D -->|"Yes"| E["Claude Opus 4.6
SWE-bench 80.9%"] D -->|"No"| F{"速度重視?"} F -->|"Yes"| C F -->|"No"| G{"100万トークン
コンテキスト必要?"} G -->|"Yes"| C G -->|"No"| E
Qwen 3.6 Plusが適している場面:
- コストを抑えたい(Claude比14分の1)
- 推論速度が重要(高速な推論)
- 長文ドキュメントの処理(100万トークン)
- エージェントワークフローの構築
Claude Opus 4.6が適している場面:
- SWE-benchで測定されるコーディング精度が最優先
- 既存のAnthropic APIエコシステムとの統合
- データのプライバシーが重要(Qwenはデータ収集あり)
1日1.4兆トークンという数字は、開発者コミュニティがQwen 3.6 Plusに強い関心を寄せていることの証明だ。少なくとも無料プレビュー期間中に試す価値はある。
関連記事: LLMとは?仕組みからローカル実行まで徹底解説【2026年完全ガイド】
参照ソース
- OpenRouter公式ポスト(X)
- Qwen公式ブログ: Qwen3.6-Plus — Towards Real World Agents
- OpenRouter: Qwen 3.6 Plus Preview
- Caixin Global: Alibaba Releases Qwen 3.6-Plus
- BuildFastWithAI: Qwen 3.6 Plus Preview Review
この記事はAI業界の最新動向を速報でお届けする「AI Heartland ニュース」です。