AI代理競賽正在失控：AI筆記 Composer 2.5 如何重新定義「工作系統」

過去兩年，大眾習慣用一個單一維度理解AI競賽：誰的模型比較強。

OpenAI 的 GPT 系列、Anthropic 的 Claude、以及各種開源模型，看似在同一條賽道上競爭。

但在內部開發者與工具層的世界裡，競爭早已悄悄改變。

真正的戰場不是模型，而是「誰能控制人類與AI協作的整個工作流。」

這也是為什麼 Cursor、Codex、Composer 2.5 這類產品突然變得關鍵。

筆者透過 AIMochi 筆記工具，整理多方公開資訊和最新報導內容，來探討這些內容不只是模型，更是「代理操作系統」。

Composer 2.5：一個被低估的轉折點

Composer 2.5 的發布，最初被視為「更便宜的模型版本」。

但數據顯示事情並不單純：

Terminal Bench 2.0：69.3%
SWE-bench 多語任務：79.8%
Cursor內部測試：接近頂級模型水準

更重要的是成本結構：

運行成本比主流 frontier 模型低 5～10 倍
token效率顯著提升
適合高頻代理任務

這代表什麼？

代表 AI 不再是「昂貴推理引擎」，而變成：可以長時間運行的工作節點（persistent worker）

這一點，才是真正的轉折。

模型戰爭的下一階段：從「聰明」到「可持續」

如果說 GPT-4 時代的核心問題是：AI有多聰明？

那 Composer 2.5 開始回答的是：AI能不能一直工作？

這直接改變三件事：

① 成本結構

模型不再只用於「問答」，而是：

持續 debug
持續寫 code
持續修復系統

② 任務形態

從：prompt → response

變成：goal → loop → feedback → correction

③ 工具整合

模型開始依賴：

IDE
terminal
browser
Slack / GitHub / Notion

AI變成「系統中的行動者」。

Cursor的真正焦慮：模型會吞掉工具嗎？

Cursor 是這場變革中最關鍵的角色之一。

它的核心焦慮非常明確：如果模型公司自己做工具，那工具公司還有價值嗎？

這形成一個新的戰爭結構：

OpenAI / Anthropic → 做模型 + 工具化
Cursor → 做工具 + 模型內化
XAI → 做算力 + 模型垂直整合

甚至 Cursor 內部已經意識到：用戶行為數據本身就是下一代模型訓練燃料

這導致一個不可逆趨勢：工具正在變成模型公司；模型正在變成工具公司

邊界開始消失。

Codex與Composer代表的不是產品，而是「工作型態轉移」

在這場討論中，OpenAI Codex 代表另一條路徑：

不是強模型，而是強工作流。

Codex / Composer 2.5 / Cursor 的共同點是：

1. 持久化任務（Persistent Threads）

不再是聊天，而是：

一個任務持續存在
可以跨時間更新
可以持續修正

2. 記憶外部化（External Memory）

AI不再依賴上下文窗口，而是：

Obsidian / GitHub / docs
structured memory
task logs

3. 人類角色改變

人類不再是「操作員」，而是：steering system（引導者）

九大工作系統設計法：AI開始像操作系統一樣運作

在實務中，這些工具開始收斂出一套模式：

① 單線程工作法

每個任務一條 thread，不混雜上下文

② 語音優先輸入

降低「格式化思考成本」

③ 即時 steering

不中斷任務持續修正方向

④ 外部記憶庫

Notion / GitHub / Obsidian 成為 AI memory layer

⑤ 工具分層使用

電腦：文件 / code
browser：即時資訊
connectors：平台數據

⑥ heartbeat system

定時喚醒 AI 任務（每 15~30 分鐘）

⑦ 目標驅動（goal-based execution）

不是 prompt，而是 success condition

⑧ side panel workflow

AI變成「並行工作區」

⑨ remote execution

手機成為控制端，而不是執行端

AI正在變成「持續運行的代理」

這是整篇內容的核心。

傳統AI：使用者問 → AI回答 → 結束

新AI系統：任務建立 → AI持續運行 → 人類介入 steering → 任務完成

這種差異，本質上等於：從「搜尋引擎」，變成「工作代理」

Cloudflare與安全模型的另一條線

Cloudflare 在安全研究中指出：

新型AI模型已經能：

建立漏洞利用鏈
自動生成 exploit chain
迭代修復與攻擊

AI不只是生產力工具，也變成：可編排攻擊與防禦的系統

這讓 AI agent 的治理問題變得更急迫。

真正的競爭已經不是模型，而是「控制平面」

當 AI 開始進入企業流程，最大問題變成：誰控制 token 流向？

誰控制：

計算資源
prompt pipeline
memory layer
tool access

這也是為什麼企業開始建立：

AI control plane
agent orchestration layer
model routing system

因為未來不是「用哪個模型」，而是：誰決定模型怎麼被使用。

以上僅供參考與資訊分享之用!若想快速了解更多資訊，透過 AIMochi 筆記工具，幫我們從海量資料中，梳理出關鍵資訊，讓我們精準掌握重要訊息!

| 馬上開始使用AIMochi