OpenRouter 點名多個代表:DeepSeek V4 Flash 用超便宜價格打進真實 agentic 流程、GLM 5.2 以 Artificial Analysis 評測第一名接下品質王座、輝達 Nemotron 3 Ultra 代表完全開放的美國隊。
(前情提要:AI 高定價時代終結倒數?Token 必會降價的五大結構性理由)
(背景補充:Anthropic全面封殺中國!中資海內外公司均禁止使用Claude,拉起國安防線)
本文目錄
- DeepSeek 把價格打到地板
- GLM 接下品質王座
- 美國隊:輝達 Nemotron 3 Ultra
兩年前,開放權重的王座還屬於 Meta 的 Llama。如今全世界最大的中立 LLM 路由器 OpenRouter 數據顯示:Llama 已徹底跌出榜單。截至 2026 年 5 月,中國的開放權重模型已吃下該平台約 61% 的 token 消耗,光是 DeepSeek 單週就佔掉百分之十七點六。
格局翻轉的背後,是一個被低估的事實:開放權重模型的智慧與能力,穩定維持在美國前沿實驗室身後三到六個月,而且這道差距沒有在擴大。對任何把雲端帳單攤開來看的組織來說,把工作負載從前沿模型搬到開放權重,省下的是真金白銀。
DeepSeek 把價格打到地板
DeepSeek V4 Flash 是第一個被團隊直接丟進真實 agentic 流程、當成 Anthropic 或 OpenAI 級前沿模型替代品來用的開放權重模型。更大的 V4 Pro 版在 SWE-bench Verified 拿下八成零六,是開放權重最高分(SWE-bench Verified 白話說就是,一套用真實 GitHub 程式修補任務來考模型會不會寫程式的考卷)
DeepSeek V4-Pro
- 快取未命中輸入費用:每百萬 Tokens 美金 0.30 元
- 快取命中輸入費用:每百萬 Tokens 美金 0.03 元
- 輸出費用:每百萬 Tokens 美金 0.50 元
DeepSeek R1 (深度推理與思考專家)
- 快取未命中輸入費用:每百萬 Tokens 美金 0.55 元
- 快取命中輸入費用:每百萬 Tokens 美金 0.14 元
- 輸出費用:每百萬 Tokens 美金 2.19 元
DeepSeek V4-Flash (極速與低成本首選)
- 快取未命中輸入費用:每百萬 Tokens 美金 0.14 元
- 快取命中輸入費用:每百萬 Tokens 美金 0.0028 元
- 輸出費用:每百萬 Tokens 美金 0.28 元
GLM 接下品質王座
由 z-ai 在六月中發布的開放模型 GLM 5.2,被第三方評測機構 Artificial Analysis 的 Intelligence Index v4.1 列為開放權重第一名,五十一分,領先 Nemotron 3 Ultra 的四十八分、MiniMax M3 與 DeepSeek V4 Pro 的四十四分,只比封閉的 Claude Fable 5 低約五分。在更貼近真實情境的 agentic 評測 GDPval-AA 上,它約與 GPT-5.5 同級。
它的長處是規劃。架構設計、整個 repo 規模的重構、跑很久的長程 agent 任務,GLM 5.2 是目前最接近 Opus 風格的可攜替代品。代價是它很愛想:OpenRouter 加權平均實際定價每百萬 token 0.447 美元輸入、3.31 美元輸出。
更耐人尋味的是時機。GLM 5.2 登場的前幾天,美國一紙出口管制指令,逼得 Anthropic 為了防止外國國民存取而廣泛停用 Fable 5 與 Mythos 5。一邊是封閉模型因地緣政治說斷就斷,一邊是 MIT 授權、接近前沿、誰都能自架的開放權重。
美國隊:輝達 Nemotron 3 Ultra
開放權重不只產自中國,輝達近期也釋出 Nemotron 3 Ultra,它在同一份榜單拿四十八分,是最強的美國開放權重,僅次 GLM 5.2。
5500 億參數、550 億 active,混合 Mamba-2 與 Transformer 架構,採 OpenMDW 授權;OpenMDW 白話說就是,不只放權重,連訓練資料、配方、評測工具一起開源。輝達的算盤很直白:開放模型用得越多,跑這些模型的 Blackwell 晶片、CUDA 與企業服務就賣得越多。
📍相關報導📍
MiniMax M3 正式開源:428B 原生多模態 MoE、1M 超長上下文
Nvidia 推出最強開源模型 Nemotron 3 Ultra!專注 AI 代理任務,效能狂飆 5 倍、降本 30%
美中 AI 對抗白熱化,但兩國學者共識一致:別讓 AI 迎來「車諾比時刻」



