Qwen 3.6 Plus徹底解説｜1日1.4兆トークン突破の中身とClaude/GPTとのタスク別使い分け

Qwen 3.6 Plus

llm benchmark agent

2026.04.04 1分更新 2026.05.01

A AI Heartland · 編集部

Qwen 3.6 Plus徹底解説｜1日1.4兆トークン突破の中身とClaude/GPTとのタスク別使い分け - AIツール日本語解説 | AI Heartland

AlibabaのQwen 3.6 PlusがOpenRouterで1日1.4兆トークンを処理。100万トークンのコンテキストウィンドウ、SWE-bench 78.8%、Claudeより高速な推論速度を実現。現在無料プレビュー中。

この記事ではLLMに特化して解説します。LLM全般は LLMとは？仕組みからローカル実行まで徹底解説【2026年完全ガイド】をご覧ください。

Qwen 3.6 Plusが樹立した「1日1.4兆トークン」の衝撃

OpenRouterが2026年4月4日に発表した数字は、LLM業界の勢力図を書き換えるものだった。

Qwen 3.6 Plus は、OpenRouter上で1日に1兆トークンを処理した最初のモデルになった。約1,400,000,000,000トークン——2026年にリリースされたモデルの中で、最も強力な初日パフォーマンスだ。

AlibabaのQwenチームが開発したこのモデルは、リリース初日から40万件のリクエストを処理し、4億以上の完了トークンを生成した。

flowchart LR A["Qwen 3.6 Plus
リリース"] --> B["初日40万リクエスト"] B --> C["1.4兆トークン処理"] C --> D["OpenRouter史上
最大の1日処理量"]

Qwen 3.6の位置づけと前世代モデルとの差分

「qwen 3.6」で情報を探している読者がまず押さえたいのは、「Qwen 3.6がQwenファミリーのどこに位置するモデルで、3.5世代と何が変わったのか」という点だ。Qwen 3.6はAlibaba Cloud（Tongyi Lab）が2026年3月31日にプレビュー公開、4月2日に正式リリースしたフラグシップLLMで、Qwen 3ファミリーの最新世代にあたる。リリース初日でOpenRouter上1日1.4兆トークンという過去最大の処理量を達成した点が特徴的だ。

Qwen 3.6は単一のモデルを指す名称ではなく、フラグシップAPIの Qwen 3.6 Plus（本記事の主題）と、オープンソース版の Qwen 3 Dense / MoE（Apache 2.0ライセンス）の2系統で構成されている。Qwen 3.6 Plusはクローズドソースで、Alibaba BailianとOpenRouter経由で利用する。

前世代 Qwen 3.5 Plus との主な差分を整理する。

差分項目	Qwen 3.5 Plus	Qwen 3.6 Plus	インパクト
コンテキスト長	128Kトークン	100万トークン（約2,000ページ）	長文ドキュメント一括処理が現実的に
推論方式	オプションCoT	常時Chain-of-Thought	毎クエリで段階的推論が効く
過剰思考問題	発生あり	修正済み	トークン浪費・応答遅延が軽減
マルチステップ信頼性	中程度	大幅改善	エージェントワークフローで差が出る
関数呼び出し	基本サポート	ネイティブ関数呼び出し	ツール利用の成功率向上
アーキテクチャ	Dense中心	Hybrid（Linear Attention + Sparse MoE）	速度と長文処理の両立

特に100万トークンのコンテキストウィンドウとネイティブFunction Callingの2点が3.6世代の実用的な価値を決めている。長文ドキュメント（法務契約・研究論文・大規模コードベース）の一括解析が1APIコールで完結し、Claude Opus 4.6比で入出力コスト約14分の1という料金優位性と組み合わさる。Qwenチームが公式ブログで「Towards Real World Agents」と掲げているとおり、3.6世代はエージェント利用を第一想定としたモデルである。

LLMベンチマーク比較――Qwen 3.6 Plus vs Claude vs GPT

Qwen 3.6 Plusのベンチマーク結果は、用途によってClaude Opus 4.6やGPT-5.4と互角以上の性能を示している。

ベンチマーク	Qwen 3.6 Plus	Claude Opus 4.6	GPT-5.4	概要
SWE-bench Verified	78.8%	80.9%	57.7%	ソフトウェア工学タスク
Terminal-Bench 2.0	61.6%	59.3%	—	ターミナル操作
OmniDocBench v1.5	91.2%	87.7%	—	ドキュメント理解
RealWorldQA	85.4%	77.0%	—	実世界の質問応答

SWE-benchではClaude Opus 4.6がリードするが、ターミナル操作・ドキュメント理解・実世界QAではQwen 3.6 Plusが上回る。特にRealWorldQAでの8ポイント以上の差は注目に値する。

推論速度の優位性

コミュニティの報告によると、Qwen 3.6 PlusはClaude Opus 4.6と比較してより高速な推論を実現している。結論に到達するまでのトークン消費量も少なく、判断が「より決断力がある」と評価されている。

Qwen 3.6 Plusの技術仕様

# Qwen 3.6 Plus 主要スペック
name: Qwen3.6-Plus
developer: Alibaba Cloud / Tongyi Lab
release: 2026-03-31 (preview), 2026-04-02 (official)
context_window: 1,000,000 tokens  # 100万トークン
max_output: 65,536 tokens
architecture: Hybrid (Linear Attention + Sparse MoE)
reasoning: Always-on Chain-of-Thought  # 常時有効
tool_use: Native function calling
parameters: Not disclosed  # 非公開
license: Proprietary (closed source)

前バージョンからの改善点

Qwen 3.5 Plusからの主な改善点は以下の通り。

項目	Qwen 3.5 Plus	Qwen 3.6 Plus
コンテキスト	128Kトークン	100万トークン
推論	オプション	常時有効CoT
「過剰思考」問題	あり	修正済み
マルチステップ信頼性	中程度	大幅改善
エージェント性能	基本的	ネイティブ対応

Qwen 3.6 Plusの料金比較――LLM APIコスト

Qwen 3.6 Plusの最大の武器はコストパフォーマンスだ。

モデル	入力（/100万トークン）	出力（/100万トークン）	コスト比
Qwen 3.6 Plus	$0（プレビュー）	$0（プレビュー）	無料
Qwen 3.6 Plus（Bailian）	$0.29	$1.71	1x
GPT-5.4	$2.50	$15.00	8.6x
Claude Opus 4.6	$5.00	$25.00	14.6x

Alibaba Bailianでの正規料金でも、Claude Opus 4.6の約14分の1。現在のOpenRouterプレビューなら完全無料で試せる。

エージェント機能――「Towards Real World Agents」

Qwen 3.6 Plusの公式ブログタイトルは「Towards Real World Agents」。エージェント用途に特化した設計が特徴だ。

flowchart TD A["ユーザーの指示"] --> B["Qwen 3.6 Plus
タスク分解"] B --> C["コード生成・テスト"] B --> D["ドキュメント分析
（100万トークン）"] B --> E["ツール呼び出し
（Function Calling）"] C --> F["反復デバッグ"] D --> F E --> F F --> G["結果統合・出力"]

主なエージェント機能は以下の通り。

# Qwen 3.6 Plus のFunction Calling例（OpenRouter経由）
import openai

client = openai.OpenAI(
    base_url="https://openrouter.ai/api/v1",
    api_key="YOUR_OPENROUTER_KEY",
)

response = client.chat.completions.create(
    model="qwen/qwen3.6-plus-preview",
    messages=[
        {"role": "user", "content": "このPRのコードレビューをして"}
    ],
    tools=[{
        "type": "function",
        "function": {
            "name": "read_file",
            "description": "ファイルの内容を読む",
            "parameters": {
                "type": "object",
                "properties": {
                    "path": {"type": "string"}
                },
                "required": ["path"]
            }
        }
    }],
)

エージェントコーディング: 複雑なプログラミングタスクを分解し、コード生成→テスト→デバッグを反復実行
フロントエンド生成: スクリーンショットやデザインドラフトからWebページを自動生成
長文ドキュメント推論: 100万トークンのコンテキストで約2,000ページを一度に処理可能

利用方法――OpenRouterで今すぐ無料で試す

# curlで直接試す
curl https://openrouter.ai/api/v1/chat/completions \
  -H "Authorization: Bearer $OPENROUTER_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "qwen/qwen3.6-plus-preview",
    "messages": [{"role": "user", "content": "Hello, Qwen 3.6 Plus!"}]
  }'

# 無料版エンドポイント
# model: "qwen/qwen3.6-plus-preview:free"

OpenRouterでのモデルID:

プレビュー版: qwen/qwen3.6-plus-preview
無料版: qwen/qwen3.6-plus-preview:free

注意: OpenRouterの記載によると、「プロンプトと完了データはモデル改善に使用される可能性がある」とのこと。機密データの入力は避けるべきだ。

オープンソース版との位置づけ

Qwen 3.6 Plus自体はクローズドソースだが、Qwen 3ファミリーの他のモデルはApache 2.0ライセンスでオープンソース公開されている。

モデル	ライセンス	用途
Qwen 3.6 Plus	クローズド	フラグシップAPI
Qwen 3 Dense (0.6B〜32B)	Apache 2.0	ローカル実行
Qwen 3 MoE (30B/235B)	Apache 2.0	高性能ローカル

vLLMなどのローカル実行環境でオープンソース版を使いつつ、高性能が必要な場面でQwen 3.6 Plus APIを使い分ける戦略が現実的だ。

Qwen 3.6を実運用で使うときに踏みやすい3つの落とし穴

ベンチマーク値だけ見ると「Claudeより安くて速い」と即決しがちだが、Qwen 3.6 Plusを実プロダクトに入れるときに事前確認すべき制約を挙げる。日本企業の検討時に頻出する論点だ。

落とし穴	具体的な制約	回避策
データ収集ポリシー	OpenRouterプレビュー版は入出力データがモデル学習に再利用される可能性あり	機密データは Alibaba Bailian の正規API（学習利用なしオプション）か、オープンソース版 Qwen 3 Dense をローカル運用
レート制限の急変	無料プレビュー期間終了で従量課金へ自動移行する可能性	コスト上限を OpenRouter の Limits で必ず設定（`max_tokens` の事前指定も必須）
日本語の語彙バイアス	中国語LLMベース。固有名詞・敬語・業界専門用語で英語直訳的な表現が出やすい	システムプロンプトで「日本のビジネス文書として自然な敬語」を明示

特にデータ収集ポリシーは契約・法務部門が必ず止めるポイント。「OpenRouter経由のQwenはデータが学習利用される」という事実を読み飛ばさないことが重要だ。Claude APIやBedrock経由のClaudeはデータ学習利用なしが標準だが、Qwenはエンドポイントで挙動が変わる。

Qwen 3.6 vs Claude vs GPT — タスク別の使い分け早見表

ベンチマークだけでなく、料金・データ取り扱い・日本語精度・推論速度の4軸で「タスク別に最適なモデル」を整理した。

タスク	第一候補	第二候補	理由
大量バッチのテキスト分類	Qwen 3.6 Plus	GPT-5.4 mini	コスト効率最優先
本番アプリのコード生成	Claude Opus 4.6	GPT-5.4	SWE-bench 80.9%・Anthropic API成熟
100万トークン超の長文処理	Qwen 3.6 Plus	Gemini 2.5 Pro	1Mコンテキスト・料金優位
日本語の社内文書要約	Claude Sonnet 4.6	GPT-5.4	敬語・固有名詞の精度
エージェントの並列推論	Qwen 3.6 Plus	Claude Sonnet 4.6	Function Callingネイティブ・低レイテンシ
機密情報を含む業務	Claude（Bedrock）	Azure OpenAI	データ学習利用なし保証

結論: Qwen 3.6 は「コスト優位」「長文」「並列エージェント」で第一候補、機密性・日本語自然性・コーディング精度ではClaudeを優先するのが2026年5月時点の現実解だ。

で、結局Qwen 3.6 Plusは使うべきか

flowchart TD A["Qwen 3.6 Plus
を検討"] --> B{"コスト重視?"} B -->|"Yes"| C["Qwen 3.6 Plus
Claude比14分の1"] B -->|"No"| D{"コーディング
精度重視?"} D -->|"Yes"| E["Claude Opus 4.6
SWE-bench 80.9%"] D -->|"No"| F{"速度重視?"} F -->|"Yes"| C F -->|"No"| G{"100万トークン
コンテキスト必要?"} G -->|"Yes"| C G -->|"No"| E

Qwen 3.6 Plusが適している場面: