xAI 在不到半個月內將 AI 寫程式工具 Grok Build 從 v0.1 連推至 v0.2.11,加入 8 代理並行、X 平台搜尋整合、Plan Mode 等功能,試圖搶下 AI 寫程式市場份額。
(前情提要:打造 3 兆美元超級巨獸?傳馬斯克有意合併 Tesla 與 SpaceX,若成功新實體將坐擁 3 萬枚 BTC)
(背景補充:Altman 收回「AI 毀滅人類工作」預言:我很高興自己錯了,真心的嗎?)
- xAI 的 Grok Build 5/14 上線後半月推至 v0.2.11,支援 8 子代理並行、X 搜尋整合、Plan Mode 預設開啟
- xAI 從 Cursor 挖來工程與產品主管,並取得 Cursor 母公司 600 億美元收購選擇權,放棄須付 100 億違約金
- SWE-bench Verified 基準測試 70.8%,與 Claude Code 87.6%、OpenAI Codex CLI 85-88.7% 仍有顯著差距
半個月推了 11 版,xAI 的 AI 寫程式工具 Grok Build 用兩週的時間走完多數競品半年的更新節奏。這套 CLI 優先的 Agentic Coding 工具 5/14 以早期測試版上線,以自家 grok-code-fast-1 模型驅動,256K token 上下文視窗,支援最多 8 個子代理在獨立 Git worktree 中並行運作。
內建 Plan Mode 預設開啟(編輯程式碼前須經使用者核准),並且是目前唯一整合 X 平台即時搜尋的 AI 寫程式工具,能在開發流程中直接查詢社群討論、追蹤 API 爭議。
最新一輪更新集中在四個面向,Agent 能力方面,子代理可跨會話共享終端後端與任務排程,新增「懶惰偵測器」與主動提醒機制;相容性方面,新增 Windows ARM64 與 macOS x86_64 支援,修復 Linux Wayland、WSL 複製貼上問題。
使用體驗方面,終端影片播放拉到 30FPS,支援多圖片貼上與 macOS 截圖快捷鍵;穩定性方面,預設重試預算提高至約 5 分鐘,強化背景工具的逾時處理。
挖角 Cursor 兩核心人物
光靠版本號衝刺不夠,xAI 同步從人才面下手,他們從估值 500 億美元的 Cursor 母公司 Anysphere 挖來工程主管 Andrew Milich 與產品主管 Jason Ginsberg,另從 Mistral AI 引入 Devendra Singh Chaplot。
更值得注意的是,xAI 在 4 月時與 Anysphere 簽下一紙選擇權協議,可在 2026 年稍後以 600 億美元收購 Cursor 整套團隊與產品,若放棄則支付 100 億美元違約金。Cursor 目前已使用 xAI 位於田納西州的 Colossus 超級電腦訓練模型。
馬斯克 3 月坦承「xAI 第一次沒做對,正在從根基重建」,xAI 的 11 位創始成員已全數離開。
SWE-bench 差距與 AI 寫程式目標
Grok Build 在 SWE-bench Verified 拿到 70.8%,而 Anthropic 的 Claude Code 為 87.6%、OpenAI Codex CLI 達 85 至 88.7%,差距接近一整個世代。不過 xAI 的策略不只拚基準分,8 個子代理並行是同類工具中最多,且 Grok Build 能直接讀取 Claude Code 使用者的 skills、plugins、hooks 設定檔,等於零遷移成本。
一位 Medium 測試者發現 Grok Build 啟動時自動載入了 47 個 skills,其中 12 個來自 Claude Code 的設定目錄。
2026 年 AI 寫程式市場規模已達 128 億美元,84% 的開發者使用或計畫使用 AI 工具,中位數每人同時用 3.1 套。Cursor 以 20 億美元年營收和 100 萬付費使用者居首;Claude Code 拿到 28% 的主工具市佔率與 46% 的「最愛工具」票選第一;GitHub Copilot 擁有 470 萬付費訂戶。
Grok Build 定價跟著 xAI 訂閱制走:SuperGrok 月費 30 美元、X Premium+ 40 美元可用,SuperGrok Heavy 300 美元(前 6 月優惠 99 美元)解鎖全量。Arena Mode(多代理競爭自動評分)是宣傳中的旗艦功能,但截至 v0.2.11 仍未上線。
常見問題Grok Build 是什麼?需要付費嗎?
xAI 推出的 CLI 優先 AI 寫程式工具,5/14 早期測試上線。須訂閱 SuperGrok(月費 30 美元)、X Premium+(40 美元)或 SuperGrok Heavy(300 美元)才能使用,無免費方案。
Grok Build 和 Claude Code 差多少?
SWE-bench Verified 基準測試 Grok Build 得分 70.8%,Claude Code 為 87.6%,差近 17 個百分點。不過 Grok Build 支援最多 8 個子代理並行,且能讀取 Claude Code 設定檔零成本遷移。
📍相關報導📍
CZ 看未來 AI 產業「會指數級暴增」,但大多數公司都會倒!
Gemini 預測市場升級 AI 大腦:接入 Grok 客製化,自動推薦你的看盤清單
如何獲得 Anthropic 錄取機會?五輪面試加一場「像心理諮商的文化拷問」






