OpenRouter：中美 AI 差距只有 3~6 個月，開源模型正席捲世界

OpenRouter 點名多個代表：DeepSeek V4 Flash 用超便宜價格打進真實 agentic 流程、GLM 5.2 以 Artificial Analysis 評測第一名接下品質王座、輝達 Nemotron 3 Ultra 代表完全開放的美國隊。
（前情提要：AI 高定價時代終結倒數？Token 必會降價的五大結構性理由）
（背景補充：Anthropic全面封殺中國！中資海內外公司均禁止使用Claude，拉起國安防線）

本文目錄

Toggle

DeepSeek 把價格打到地板
GLM 接下品質王座
美國隊：輝達 Nemotron 3 Ultra

兩年前，開放權重的王座還屬於 Meta 的 Llama。如今全世界最大的中立 LLM 路由器 OpenRouter 數據顯示：Llama 已徹底跌出榜單。截至 2026 年 5 月，中國的開放權重模型已吃下該平台約 61% 的 token 消耗，光是 DeepSeek 單週就佔掉百分之十七點六。

格局翻轉的背後，是一個被低估的事實：開放權重模型的智慧與能力，穩定維持在美國前沿實驗室身後三到六個月，而且這道差距沒有在擴大。對任何把雲端帳單攤開來看的組織來說，把工作負載從前沿模型搬到開放權重，省下的是真金白銀。

DeepSeek 把價格打到地板

DeepSeek V4 Flash 是第一個被團隊直接丟進真實 agentic 流程、當成 Anthropic 或 OpenAI 級前沿模型替代品來用的開放權重模型。更大的 V4 Pro 版在 SWE-bench Verified 拿下八成零六，是開放權重最高分（SWE-bench Verified 白話說就是，一套用真實 GitHub 程式修補任務來考模型會不會寫程式的考卷）

DeepSeek V4-Pro

快取未命中輸入費用：每百萬 Tokens 美金 0.30 元
快取命中輸入費用：每百萬 Tokens 美金 0.03 元
輸出費用：每百萬 Tokens 美金 0.50 元

DeepSeek R1 (深度推理與思考專家)

快取未命中輸入費用：每百萬 Tokens 美金 0.55 元
快取命中輸入費用：每百萬 Tokens 美金 0.14 元
輸出費用：每百萬 Tokens 美金 2.19 元

DeepSeek V4-Flash (極速與低成本首選)

快取未命中輸入費用：每百萬 Tokens 美金 0.14 元
快取命中輸入費用：每百萬 Tokens 美金 0.0028 元
輸出費用：每百萬 Tokens 美金 0.28 元

快取命中是指：當重複輸入相同提示詞或歷史對話時，輸入費用會大幅降低 70% 至 90%。

GLM 接下品質王座

由 z-ai 在六月中發布的開放模型 GLM 5.2，被第三方評測機構 Artificial Analysis 的 Intelligence Index v4.1 列為開放權重第一名，五十一分，領先 Nemotron 3 Ultra 的四十八分、MiniMax M3 與 DeepSeek V4 Pro 的四十四分，只比封閉的 Claude Fable 5 低約五分。在更貼近真實情境的 agentic 評測 GDPval-AA 上，它約與 GPT-5.5 同級。

它的長處是規劃。架構設計、整個 repo 規模的重構、跑很久的長程 agent 任務，GLM 5.2 是目前最接近 Opus 風格的可攜替代品。代價是它很愛想：OpenRouter 加權平均實際定價每百萬 token 0.447 美元輸入、3.31 美元輸出。

更耐人尋味的是時機。GLM 5.2 登場的前幾天，美國一紙出口管制指令，逼得 Anthropic 為了防止外國國民存取而廣泛停用 Fable 5 與 Mythos 5。一邊是封閉模型因地緣政治說斷就斷，一邊是 MIT 授權、接近前沿、誰都能自架的開放權重。

美國隊：輝達 Nemotron 3 Ultra

開放權重不只產自中國，輝達近期也釋出 Nemotron 3 Ultra，它在同一份榜單拿四十八分，是最強的美國開放權重，僅次 GLM 5.2。

5500 億參數、550 億 active，混合 Mamba-2 與 Transformer 架構，採 OpenMDW 授權；OpenMDW 白話說就是，不只放權重，連訓練資料、配方、評測工具一起開源。輝達的算盤很直白：開放模型用得越多，跑這些模型的 Blackwell 晶片、CUDA 與企業服務就賣得越多。