AIMochi | AI代理競賽正在失控:AI筆記 Composer 2.5 如何重新定義「工作系統」
AI代理競賽正在失控:AI筆記 Composer 2.5 如何重新定義「工作系統」

AI代理競賽正在失控:AI筆記 Composer 2.5 如何重新定義「工作系統」

過去兩年,大眾習慣用一個單一維度理解AI競賽:誰的模型比較強。

OpenAI 的 GPT 系列、Anthropic 的 Claude、以及各種開源模型,看似在同一條賽道上競爭。

但在內部開發者與工具層的世界裡,競爭早已悄悄改變。

真正的戰場不是模型,而是「誰能控制人類與AI協作的整個工作流。」

這也是為什麼 Cursor、Codex、Composer 2.5 這類產品突然變得關鍵。

筆者透過 AIMochi 筆記工具,整理多方公開資訊和最新報導內容,來探討這些內容不只是模型,更是「代理操作系統」。

Composer 2.5:一個被低估的轉折點

Composer 2.5 的發布,最初被視為「更便宜的模型版本」。

但數據顯示事情並不單純:

  • Terminal Bench 2.0:69.3%

  • SWE-bench 多語任務:79.8%

  • Cursor內部測試:接近頂級模型水準

更重要的是成本結構:

  • 運行成本比主流 frontier 模型低 5~10 倍

  • token效率顯著提升

  • 適合高頻代理任務

這代表什麼?

代表 AI 不再是「昂貴推理引擎」,而變成:可以長時間運行的工作節點(persistent worker)

這一點,才是真正的轉折。

模型戰爭的下一階段:從「聰明」到「可持續」

如果說 GPT-4 時代的核心問題是:AI有多聰明?

那 Composer 2.5 開始回答的是:AI能不能一直工作?

這直接改變三件事:

① 成本結構

模型不再只用於「問答」,而是:

  • 持續 debug

  • 持續寫 code

  • 持續修復系統

② 任務形態

從:prompt → response

變成:goal → loop → feedback → correction

③ 工具整合

模型開始依賴:

  • IDE

  • terminal

  • browser

  • Slack / GitHub / Notion

AI變成「系統中的行動者」。

Cursor的真正焦慮:模型會吞掉工具嗎?

Cursor 是這場變革中最關鍵的角色之一。

它的核心焦慮非常明確:如果模型公司自己做工具,那工具公司還有價值嗎?

這形成一個新的戰爭結構:

  • OpenAI / Anthropic → 做模型 + 工具化

  • Cursor → 做工具 + 模型內化

  • XAI → 做算力 + 模型垂直整合

甚至 Cursor 內部已經意識到:用戶行為數據本身就是下一代模型訓練燃料

這導致一個不可逆趨勢:工具正在變成模型公司;模型正在變成工具公司

邊界開始消失。

Codex與Composer代表的不是產品,而是「工作型態轉移」

在這場討論中,OpenAI Codex 代表另一條路徑:

不是強模型,而是強工作流。

Codex / Composer 2.5 / Cursor 的共同點是:

1. 持久化任務(Persistent Threads)

不再是聊天,而是:

  • 一個任務持續存在

  • 可以跨時間更新

  • 可以持續修正

2. 記憶外部化(External Memory)

AI不再依賴上下文窗口,而是:

  • Obsidian / GitHub / docs

  • structured memory

  • task logs

3. 人類角色改變

人類不再是「操作員」,而是:steering system(引導者)

九大工作系統設計法:AI開始像操作系統一樣運作

在實務中,這些工具開始收斂出一套模式:

① 單線程工作法

每個任務一條 thread,不混雜上下文

② 語音優先輸入

降低「格式化思考成本」

③ 即時 steering

不中斷任務持續修正方向

④ 外部記憶庫

Notion / GitHub / Obsidian 成為 AI memory layer

⑤ 工具分層使用

  • 電腦:文件 / code

  • browser:即時資訊

  • connectors:平台數據

⑥ heartbeat system

定時喚醒 AI 任務(每 15~30 分鐘)

⑦ 目標驅動(goal-based execution)

不是 prompt,而是 success condition

⑧ side panel workflow

AI變成「並行工作區」

⑨ remote execution

手機成為控制端,而不是執行端

AI正在變成「持續運行的代理」

這是整篇內容的核心。

傳統AI:使用者問 → AI回答 → 結束

新AI系統:任務建立 → AI持續運行 → 人類介入 steering → 任務完成

這種差異,本質上等於:從「搜尋引擎」,變成「工作代理」

Cloudflare與安全模型的另一條線

Cloudflare 在安全研究中指出:

新型AI模型已經能:

  • 建立漏洞利用鏈

  • 自動生成 exploit chain

  • 迭代修復與攻擊

AI不只是生產力工具,也變成:可編排攻擊與防禦的系統

這讓 AI agent 的治理問題變得更急迫。

真正的競爭已經不是模型,而是「控制平面」

當 AI 開始進入企業流程,最大問題變成:誰控制 token 流向?

誰控制:

  • 計算資源

  • prompt pipeline

  • memory layer

  • tool access

這也是為什麼企業開始建立:

  • AI control plane

  • agent orchestration layer

  • model routing system

因為未來不是「用哪個模型」,而是:誰決定模型怎麼被使用。

以上僅供參考與資訊分享之用!若想快速了解更多資訊,透過 AIMochi 筆記工具,幫我們從海量資料中,梳理出關鍵資訊,讓我們精準掌握重要訊息!

| 馬上開始使用AIMochi