Qwen 3.6 Plusが1日1.4兆トークン処理でOpenRouter新記録――LLMベンチマーク比較と料金

Qwen 3.6 Plus

🚀 ニュース

TL;DR

AlibabaのQwen 3.6 PlusがOpenRouterで1日1.4兆トークンを処理し新記録を樹立。100万トークンのコンテキスト、Claude Opus超えのベンチマーク、無料プレビューの詳細を解説。

Qwen 3.6 Plusが樹立した「1日1.4兆トークン」の衝撃

OpenRouterが2026年4月4日に発表した数字は、LLM業界の勢力図を書き換えるものだった。

Qwen 3.6 Plus は、OpenRouter上で1日に1兆トークンを処理した最初のモデルになった。約1,400,000,000,000トークン——2026年にリリースされたモデルの中で、最も強力な初日パフォーマンスだ。

AlibabaのQwenチームが開発したこのモデルは、リリース初日から40万件のリクエストを処理し、4億以上の完了トークンを生成した。

flowchart LR A["Qwen 3.6 Plus
リリース"] --> B["初日40万リクエスト"] B --> C["1.4兆トークン処理"] C --> D["OpenRouter史上
最大の1日処理量"]

LLMベンチマーク比較――Qwen 3.6 Plus vs Claude vs GPT

Qwen 3.6 Plusのベンチマーク結果は、用途によってClaude Opus 4.6やGPT-5.4と互角以上の性能を示している。

ベンチマーク	Qwen 3.6 Plus	Claude Opus 4.6	GPT-5.4	概要
SWE-bench Verified	78.8%	80.9%	57.7%	ソフトウェア工学タスク
Terminal-Bench 2.0	61.6%	59.3%	—	ターミナル操作
OmniDocBench v1.5	91.2%	87.7%	—	ドキュメント理解
RealWorldQA	85.4%	77.0%	—	実世界の質問応答

SWE-benchではClaude Opus 4.6がリードするが、ターミナル操作・ドキュメント理解・実世界QAではQwen 3.6 Plusが上回る。特にRealWorldQAでの8ポイント以上の差は注目に値する。

推論速度の優位性

コミュニティの報告によると、Qwen 3.6 PlusはClaude Opus 4.6と比較して2〜3倍高速な推論を実現している。結論に到達するまでのトークン消費量も少なく、判断が「より決断力がある」と評価されている。

Qwen 3.6 Plusの技術仕様

# Qwen 3.6 Plus 主要スペック
name: Qwen3.6-Plus
developer: Alibaba Cloud / Tongyi Lab
release: 2026-03-31 (preview), 2026-04-02 (official)
context_window: 1,000,000 tokens  # 100万トークン
max_output: 65,536 tokens
architecture: Hybrid (Linear Attention + Sparse MoE)
reasoning: Always-on Chain-of-Thought  # 常時有効
tool_use: Native function calling
parameters: Not disclosed  # 非公開
license: Proprietary (closed source)

前バージョンからの改善点

Qwen 3.5 Plusからの主な改善点は以下の通り。

項目	Qwen 3.5 Plus	Qwen 3.6 Plus
コンテキスト	128Kトークン	100万トークン
推論	オプション	常時有効CoT
「過剰思考」問題	あり	修正済み
マルチステップ信頼性	中程度	大幅改善
エージェント性能	基本的	ネイティブ対応

Qwen 3.6 Plusの料金比較――LLM APIコスト

Qwen 3.6 Plusの最大の武器はコストパフォーマンスだ。

モデル	入力（/100万トークン）	出力（/100万トークン）	コスト比
Qwen 3.6 Plus	$0（プレビュー）	$0（プレビュー）	無料
Qwen 3.6 Plus（Bailian）	$0.29	$1.71	1x
GPT-5.4	$2.50	$15.00	8.6x
Claude Opus 4.6	$5.00	$25.00	14.6x

Alibaba Bailianでの正規料金でも、Claude Opus 4.6の約14分の1。現在のOpenRouterプレビューなら完全無料で試せる。

エージェント機能――「Towards Real World Agents」

Qwen 3.6 Plusの公式ブログタイトルは「Towards Real World Agents」。エージェント用途に特化した設計が特徴だ。

flowchart TD A["ユーザーの指示"] --> B["Qwen 3.6 Plus
タスク分解"] B --> C["コード生成・テスト"] B --> D["ドキュメント分析
（100万トークン）"] B --> E["ツール呼び出し
（Function Calling）"] C --> F["反復デバッグ"] D --> F E --> F F --> G["結果統合・出力"]

主なエージェント機能は以下の通り。

# Qwen 3.6 Plus のFunction Calling例（OpenRouter経由）
import openai

client = openai.OpenAI(
    base_url="https://openrouter.ai/api/v1",
    api_key="YOUR_OPENROUTER_KEY",
)

response = client.chat.completions.create(
    model="qwen/qwen3.6-plus-preview",
    messages=[
        {"role": "user", "content": "このPRのコードレビューをして"}
    ],
    tools=[{
        "type": "function",
        "function": {
            "name": "read_file",
            "description": "ファイルの内容を読む",
            "parameters": {
                "type": "object",
                "properties": {
                    "path": {"type": "string"}
                },
                "required": ["path"]
            }
        }
    }],
)

エージェントコーディング: 複雑なプログラミングタスクを分解し、コード生成→テスト→デバッグを反復実行
フロントエンド生成: スクリーンショットやデザインドラフトからWebページを自動生成
長文ドキュメント推論: 100万トークンのコンテキストで約2,000ページを一度に処理可能

利用方法――OpenRouterで今すぐ無料で試す

# curlで直接試す
curl https://openrouter.ai/api/v1/chat/completions \
  -H "Authorization: Bearer $OPENROUTER_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "qwen/qwen3.6-plus-preview",
    "messages": [{"role": "user", "content": "Hello, Qwen 3.6 Plus!"}]
  }'

# 無料版エンドポイント
# model: "qwen/qwen3.6-plus-preview:free"

OpenRouterでのモデルID:

プレビュー版: qwen/qwen3.6-plus-preview
無料版: qwen/qwen3.6-plus-preview:free

注意: OpenRouterの記載によると、「プロンプトと完了データはモデル改善に使用される可能性がある」とのこと。機密データの入力は避けるべきだ。

オープンソース版との位置づけ

Qwen 3.6 Plus自体はクローズドソースだが、Qwen 3ファミリーの他のモデルはApache 2.0ライセンスでオープンソース公開されている。

モデル	ライセンス	用途
Qwen 3.6 Plus	クローズド	フラグシップAPI
Qwen 3 Dense (0.6B〜32B)	Apache 2.0	ローカル実行
Qwen 3 MoE (30B/235B)	Apache 2.0	高性能ローカル

vLLMなどのローカル実行環境でオープンソース版を使いつつ、高性能が必要な場面でQwen 3.6 Plus APIを使い分ける戦略が現実的だ。

で、結局Qwen 3.6 Plusは使うべきか

flowchart TD A["Qwen 3.6 Plus
を検討"] --> B{"コスト重視?"} B -->|"Yes"| C["Qwen 3.6 Plus
Claude比14分の1"] B -->|"No"| D{"コーディング
精度重視?"} D -->|"Yes"| E["Claude Opus 4.6
SWE-bench 80.9%"] D -->|"No"| F{"速度重視?"} F -->|"Yes"| C F -->|"No"| G{"100万トークン
コンテキスト必要?"} G -->|"Yes"| C G -->|"No"| E

Qwen 3.6 Plusが適している場面: