この記事ではLLMに特化して解説します。LLM全般は LLMとは?仕組みからローカル実行まで徹底解説【2026年完全ガイド】 をご覧ください。

Qwen 3.6 Plusが樹立した「1日1.4兆トークン」の衝撃

OpenRouterが2026年4月4日に発表した数字は、LLM業界の勢力図を書き換えるものだった。

Qwen 3.6 Plus は、OpenRouter上で1日に1兆トークンを処理した最初のモデルになった。約1,400,000,000,000トークン——2026年にリリースされたモデルの中で、最も強力な初日パフォーマンスだ。

AlibabaのQwenチームが開発したこのモデルは、リリース初日から40万件のリクエストを処理し、4億以上の完了トークンを生成した。

flowchart LR A["Qwen 3.6 Plus
リリース"] --> B["初日40万リクエスト"] B --> C["1.4兆トークン処理"] C --> D["OpenRouter史上
最大の1日処理量"]

Qwen 3.6の位置づけと前世代モデルとの差分

「qwen 3.6」で情報を探している読者がまず押さえたいのは、「Qwen 3.6がQwenファミリーのどこに位置するモデルで、3.5世代と何が変わったのか」という点だ。Qwen 3.6はAlibaba Cloud(Tongyi Lab)が2026年3月31日にプレビュー公開、4月2日に正式リリースしたフラグシップLLMで、Qwen 3ファミリーの最新世代にあたる。リリース初日でOpenRouter上1日1.4兆トークンという過去最大の処理量を達成した点が特徴的だ。

Qwen 3.6は単一のモデルを指す名称ではなく、フラグシップAPIの Qwen 3.6 Plus(本記事の主題)と、オープンソース版の Qwen 3 Dense / MoE(Apache 2.0ライセンス)の2系統で構成されている。Qwen 3.6 Plusはクローズドソースで、Alibaba BailianとOpenRouter経由で利用する。

前世代 Qwen 3.5 Plus との主な差分を整理する。

差分項目 Qwen 3.5 Plus Qwen 3.6 Plus インパクト
コンテキスト長 128Kトークン 100万トークン(約2,000ページ) 長文ドキュメント一括処理が現実的に
推論方式 オプションCoT 常時Chain-of-Thought 毎クエリで段階的推論が効く
過剰思考問題 発生あり 修正済み トークン浪費・応答遅延が軽減
マルチステップ信頼性 中程度 大幅改善 エージェントワークフローで差が出る
関数呼び出し 基本サポート ネイティブ関数呼び出し ツール利用の成功率向上
アーキテクチャ Dense中心 Hybrid(Linear Attention + Sparse MoE) 速度と長文処理の両立

特に100万トークンのコンテキストウィンドウネイティブFunction Callingの2点が3.6世代の実用的な価値を決めている。長文ドキュメント(法務契約・研究論文・大規模コードベース)の一括解析が1APIコールで完結し、Claude Opus 4.6比で入出力コスト約14分の1という料金優位性と組み合わさる。Qwenチームが公式ブログで「Towards Real World Agents」と掲げているとおり、3.6世代はエージェント利用を第一想定としたモデルである。

LLMベンチマーク比較――Qwen 3.6 Plus vs Claude vs GPT

Qwen 3.6 Plusのベンチマーク結果は、用途によってClaude Opus 4.6やGPT-5.4と互角以上の性能を示している。

ベンチマーク Qwen 3.6 Plus Claude Opus 4.6 GPT-5.4 概要
SWE-bench Verified 78.8% 80.9% 57.7% ソフトウェア工学タスク
Terminal-Bench 2.0 61.6% 59.3% ターミナル操作
OmniDocBench v1.5 91.2% 87.7% ドキュメント理解
RealWorldQA 85.4% 77.0% 実世界の質問応答

SWE-benchではClaude Opus 4.6がリードするが、ターミナル操作・ドキュメント理解・実世界QAではQwen 3.6 Plusが上回る。特にRealWorldQAでの8ポイント以上の差は注目に値する。

推論速度の優位性

コミュニティの報告によると、Qwen 3.6 PlusはClaude Opus 4.6と比較してより高速な推論を実現している。結論に到達するまでのトークン消費量も少なく、判断が「より決断力がある」と評価されている。

Qwen 3.6 Plusの技術仕様

# Qwen 3.6 Plus 主要スペック
name: Qwen3.6-Plus
developer: Alibaba Cloud / Tongyi Lab
release: 2026-03-31 (preview), 2026-04-02 (official)
context_window: 1,000,000 tokens  # 100万トークン
max_output: 65,536 tokens
architecture: Hybrid (Linear Attention + Sparse MoE)
reasoning: Always-on Chain-of-Thought  # 常時有効
tool_use: Native function calling
parameters: Not disclosed  # 非公開
license: Proprietary (closed source)

前バージョンからの改善点

Qwen 3.5 Plusからの主な改善点は以下の通り。

項目 Qwen 3.5 Plus Qwen 3.6 Plus
コンテキスト 128Kトークン 100万トークン
推論 オプション 常時有効CoT
「過剰思考」問題 あり 修正済み
マルチステップ信頼性 中程度 大幅改善
エージェント性能 基本的 ネイティブ対応

Qwen 3.6 Plusの料金比較――LLM APIコスト

Qwen 3.6 Plusの最大の武器はコストパフォーマンスだ。

モデル 入力(/100万トークン) 出力(/100万トークン) コスト比
Qwen 3.6 Plus $0(プレビュー) $0(プレビュー) 無料
Qwen 3.6 Plus(Bailian) $0.29 $1.71 1x
GPT-5.4 $2.50 $15.00 8.6x
Claude Opus 4.6 $5.00 $25.00 14.6x

Alibaba Bailianでの正規料金でも、Claude Opus 4.6の約14分の1。現在のOpenRouterプレビューなら完全無料で試せる。

エージェント機能――「Towards Real World Agents」

Qwen 3.6 Plusの公式ブログタイトルは「Towards Real World Agents」。エージェント用途に特化した設計が特徴だ。

flowchart TD A["ユーザーの指示"] --> B["Qwen 3.6 Plus
タスク分解"] B --> C["コード生成・テスト"] B --> D["ドキュメント分析
(100万トークン)"] B --> E["ツール呼び出し
(Function Calling)"] C --> F["反復デバッグ"] D --> F E --> F F --> G["結果統合・出力"]

主なエージェント機能は以下の通り。

# Qwen 3.6 Plus のFunction Calling例(OpenRouter経由)
import openai

client = openai.OpenAI(
    base_url="https://openrouter.ai/api/v1",
    api_key="YOUR_OPENROUTER_KEY",
)

response = client.chat.completions.create(
    model="qwen/qwen3.6-plus-preview",
    messages=[
        {"role": "user", "content": "このPRのコードレビューをして"}
    ],
    tools=[{
        "type": "function",
        "function": {
            "name": "read_file",
            "description": "ファイルの内容を読む",
            "parameters": {
                "type": "object",
                "properties": {
                    "path": {"type": "string"}
                },
                "required": ["path"]
            }
        }
    }],
)
  • エージェントコーディング: 複雑なプログラミングタスクを分解し、コード生成→テスト→デバッグを反復実行
  • フロントエンド生成: スクリーンショットやデザインドラフトからWebページを自動生成
  • 長文ドキュメント推論: 100万トークンのコンテキストで約2,000ページを一度に処理可能

利用方法――OpenRouterで今すぐ無料で試す

# curlで直接試す
curl https://openrouter.ai/api/v1/chat/completions \
  -H "Authorization: Bearer $OPENROUTER_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "qwen/qwen3.6-plus-preview",
    "messages": [{"role": "user", "content": "Hello, Qwen 3.6 Plus!"}]
  }'

# 無料版エンドポイント
# model: "qwen/qwen3.6-plus-preview:free"

OpenRouterでのモデルID:

  • プレビュー版: qwen/qwen3.6-plus-preview
  • 無料版: qwen/qwen3.6-plus-preview:free

注意: OpenRouterの記載によると、「プロンプトと完了データはモデル改善に使用される可能性がある」とのこと。機密データの入力は避けるべきだ。

オープンソース版との位置づけ

Qwen 3.6 Plus自体はクローズドソースだが、Qwen 3ファミリーの他のモデルはApache 2.0ライセンスでオープンソース公開されている。

モデル ライセンス 用途
Qwen 3.6 Plus クローズド フラグシップAPI
Qwen 3 Dense (0.6B〜32B) Apache 2.0 ローカル実行
Qwen 3 MoE (30B/235B) Apache 2.0 高性能ローカル

vLLMなどのローカル実行環境でオープンソース版を使いつつ、高性能が必要な場面でQwen 3.6 Plus APIを使い分ける戦略が現実的だ。

Qwen 3.6を実運用で使うときに踏みやすい3つの落とし穴

ベンチマーク値だけ見ると「Claudeより安くて速い」と即決しがちだが、Qwen 3.6 Plusを実プロダクトに入れるときに事前確認すべき制約を挙げる。日本企業の検討時に頻出する論点だ。

落とし穴 具体的な制約 回避策
データ収集ポリシー OpenRouterプレビュー版は入出力データがモデル学習に再利用される可能性あり 機密データは Alibaba Bailian の正規API(学習利用なしオプション)か、オープンソース版 Qwen 3 Dense をローカル運用
レート制限の急変 無料プレビュー期間終了で従量課金へ自動移行する可能性 コスト上限を OpenRouter の Limits で必ず設定(max_tokens の事前指定も必須)
日本語の語彙バイアス 中国語LLMベース。固有名詞・敬語・業界専門用語で英語直訳的な表現が出やすい システムプロンプトで「日本のビジネス文書として自然な敬語」を明示

特にデータ収集ポリシーは契約・法務部門が必ず止めるポイント。「OpenRouter経由のQwenはデータが学習利用される」という事実を読み飛ばさないことが重要だ。Claude APIやBedrock経由のClaudeはデータ学習利用なしが標準だが、Qwenはエンドポイントで挙動が変わる。

Qwen 3.6 vs Claude vs GPT — タスク別の使い分け早見表

ベンチマークだけでなく、料金・データ取り扱い・日本語精度・推論速度の4軸で「タスク別に最適なモデル」を整理した。

タスク 第一候補 第二候補 理由
大量バッチのテキスト分類 Qwen 3.6 Plus GPT-5.4 mini コスト効率最優先
本番アプリのコード生成 Claude Opus 4.6 GPT-5.4 SWE-bench 80.9%・Anthropic API成熟
100万トークン超の長文処理 Qwen 3.6 Plus Gemini 2.5 Pro 1Mコンテキスト・料金優位
日本語の社内文書要約 Claude Sonnet 4.6 GPT-5.4 敬語・固有名詞の精度
エージェントの並列推論 Qwen 3.6 Plus Claude Sonnet 4.6 Function Callingネイティブ・低レイテンシ
機密情報を含む業務 Claude(Bedrock) Azure OpenAI データ学習利用なし保証

結論: Qwen 3.6 は「コスト優位」「長文」「並列エージェント」で第一候補、機密性・日本語自然性・コーディング精度ではClaudeを優先するのが2026年5月時点の現実解だ。

で、結局Qwen 3.6 Plusは使うべきか

flowchart TD A["Qwen 3.6 Plus
を検討"] --> B{"コスト重視?"} B -->|"Yes"| C["Qwen 3.6 Plus
Claude比14分の1"] B -->|"No"| D{"コーディング
精度重視?"} D -->|"Yes"| E["Claude Opus 4.6
SWE-bench 80.9%"] D -->|"No"| F{"速度重視?"} F -->|"Yes"| C F -->|"No"| G{"100万トークン
コンテキスト必要?"} G -->|"Yes"| C G -->|"No"| E

Qwen 3.6 Plusが適している場面:

  • コストを抑えたい(Claude比14分の1)
  • 推論速度が重要(高速な推論)
  • 長文ドキュメントの処理(100万トークン)
  • エージェントワークフローの構築

Claude Opus 4.6が適している場面:

  • SWE-benchで測定されるコーディング精度が最優先
  • 既存のAnthropic APIエコシステムとの統合
  • データのプライバシーが重要(Qwenはデータ収集あり)

1日1.4兆トークンという数字は、開発者コミュニティがQwen 3.6 Plusに強い関心を寄せていることの証明だ。少なくとも無料プレビュー期間中に試す価値はある。

関連記事: LLMとは?仕組みからローカル実行まで徹底解説【2026年完全ガイド】

参照ソース


この記事はAI業界の最新動向を速報でお届けする「AI Heartland ニュース」です。