OpenRouterが2026年4月4日に発表した数字は、LLM業界の勢力図を書き換えるものだった。
Qwen 3.6 Plus は、OpenRouter上で1日に1兆トークンを処理した最初のモデルになった。約1,400,000,000,000トークン——2026年にリリースされたモデルの中で、最も強力な初日パフォーマンスだ。
AlibabaのQwenチームが開発したこのモデルは、リリース初日から40万件のリクエストを処理し、4億以上の完了トークンを生成した。
Qwen 3.6 Plusのベンチマーク結果は、用途によってClaude Opus 4.6やGPT-5.4と互角以上の性能を示している。
| ベンチマーク | Qwen 3.6 Plus | Claude Opus 4.6 | GPT-5.4 | 概要 |
|---|---|---|---|---|
| SWE-bench Verified | 78.8% | 80.9% | 57.7% | ソフトウェア工学タスク |
| Terminal-Bench 2.0 | 61.6% | 59.3% | — | ターミナル操作 |
| OmniDocBench v1.5 | 91.2% | 87.7% | — | ドキュメント理解 |
| RealWorldQA | 85.4% | 77.0% | — | 実世界の質問応答 |
SWE-benchではClaude Opus 4.6がリードするが、ターミナル操作・ドキュメント理解・実世界QAではQwen 3.6 Plusが上回る。特にRealWorldQAでの8ポイント以上の差は注目に値する。
コミュニティの報告によると、Qwen 3.6 PlusはClaude Opus 4.6と比較して2〜3倍高速な推論を実現している。結論に到達するまでのトークン消費量も少なく、判断が「より決断力がある」と評価されている。
# Qwen 3.6 Plus 主要スペック
name: Qwen3.6-Plus
developer: Alibaba Cloud / Tongyi Lab
release: 2026-03-31 (preview), 2026-04-02 (official)
context_window: 1,000,000 tokens # 100万トークン
max_output: 65,536 tokens
architecture: Hybrid (Linear Attention + Sparse MoE)
reasoning: Always-on Chain-of-Thought # 常時有効
tool_use: Native function calling
parameters: Not disclosed # 非公開
license: Proprietary (closed source)
Qwen 3.5 Plusからの主な改善点は以下の通り。
| 項目 | Qwen 3.5 Plus | Qwen 3.6 Plus |
|---|---|---|
| コンテキスト | 128Kトークン | 100万トークン |
| 推論 | オプション | 常時有効CoT |
| 「過剰思考」問題 | あり | 修正済み |
| マルチステップ信頼性 | 中程度 | 大幅改善 |
| エージェント性能 | 基本的 | ネイティブ対応 |
Qwen 3.6 Plusの最大の武器はコストパフォーマンスだ。
| モデル | 入力(/100万トークン) | 出力(/100万トークン) | コスト比 |
|---|---|---|---|
| Qwen 3.6 Plus | $0(プレビュー) | $0(プレビュー) | 無料 |
| Qwen 3.6 Plus(Bailian) | $0.29 | $1.71 | 1x |
| GPT-5.4 | $2.50 | $15.00 | 8.6x |
| Claude Opus 4.6 | $5.00 | $25.00 | 14.6x |
Alibaba Bailianでの正規料金でも、Claude Opus 4.6の約14分の1。現在のOpenRouterプレビューなら完全無料で試せる。
Qwen 3.6 Plusの公式ブログタイトルは「Towards Real World Agents」。エージェント用途に特化した設計が特徴だ。
主なエージェント機能は以下の通り。
# Qwen 3.6 Plus のFunction Calling例(OpenRouter経由)
import openai
client = openai.OpenAI(
base_url="https://openrouter.ai/api/v1",
api_key="YOUR_OPENROUTER_KEY",
)
response = client.chat.completions.create(
model="qwen/qwen3.6-plus-preview",
messages=[
{"role": "user", "content": "このPRのコードレビューをして"}
],
tools=[{
"type": "function",
"function": {
"name": "read_file",
"description": "ファイルの内容を読む",
"parameters": {
"type": "object",
"properties": {
"path": {"type": "string"}
},
"required": ["path"]
}
}
}],
)
# curlで直接試す
curl https://openrouter.ai/api/v1/chat/completions \
-H "Authorization: Bearer $OPENROUTER_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "qwen/qwen3.6-plus-preview",
"messages": [{"role": "user", "content": "Hello, Qwen 3.6 Plus!"}]
}'
# 無料版エンドポイント
# model: "qwen/qwen3.6-plus-preview:free"
OpenRouterでのモデルID:
qwen/qwen3.6-plus-previewqwen/qwen3.6-plus-preview:free注意: OpenRouterの記載によると、「プロンプトと完了データはモデル改善に使用される可能性がある」とのこと。機密データの入力は避けるべきだ。
Qwen 3.6 Plus自体はクローズドソースだが、Qwen 3ファミリーの他のモデルはApache 2.0ライセンスでオープンソース公開されている。
| モデル | ライセンス | 用途 |
|---|---|---|
| Qwen 3.6 Plus | クローズド | フラグシップAPI |
| Qwen 3 Dense (0.6B〜32B) | Apache 2.0 | ローカル実行 |
| Qwen 3 MoE (30B/235B) | Apache 2.0 | 高性能ローカル |
vLLMなどのローカル実行環境でオープンソース版を使いつつ、高性能が必要な場面でQwen 3.6 Plus APIを使い分ける戦略が現実的だ。
Qwen 3.6 Plusが適している場面:
Claude Opus 4.6が適している場面:
1日1.4兆トークンという数字は、開発者コミュニティがQwen 3.6 Plusに強い関心を寄せていることの証明だ。少なくとも無料プレビュー期間中に試す価値はある。
この記事はAI業界の最新動向を速報でお届けする「AI Heartland ニュース」です。