第一次看到 AI 自己操作電腦時,那種感覺其實有些怪怪的......
它不再只是停留在聊天室裡回答問題,而是真的開始「行動」。
滑鼠移動,瀏覽器被打開,網頁被搜尋。Google Drive 被讀取。甚至連檔案都能被整理。
最後開始控制你的 Mac。
過去幾年,大部分人對 ChatGPT 或 Claude 的理解,仍停留在「會聊天的 AI」。
它們可以回答問題、整理資料、寫程式、翻譯文章,甚至協助研究。但本質上,它們仍然是一種「文字互動介面」。
直到 MCP 的出現,事情開始改變。
筆者透過 AIMochi 筆記工具,整理多方公開資訊和最新報導內容,來探討現在的 AI,不只是能理解我們的指令。
MCP,全名為 Model Context Protocol。
由 Anthropic 推動的 MCP,本質上是一種讓大型語言模型能與外部工具、服務與應用程式互動的協議。
如果把大型語言模型比喻成「大腦」,
那麼 MCP 更像是:
AI 與現實數位世界之間的神經系統。
它讓 AI 可以:
存取 Google Drive
操作 Gmail
使用 GitHub
控制瀏覽器
讀取 Notion
更新 WordPress
查詢 PayPal
操作桌面應用程式
控制電腦
這件事的重要性在於:
過去 AI 最大的限制,並不是「不夠聰明」。
其實是:
AI 無法真正執行事情。
它能給你建議,卻不能幫你完成。
它知道答案,卻碰不到工具。
MCP 改變了這件事。
它開始能夠替你操作世界。
這也是為什麼近年產業開始大量出現一個詞:
AI Agent
Agent 與 Chatbot 最大的差別,在於:
Chatbot 只能對話
Agent 能夠行動
這種差異,看似只有一步,但實際上是整個 AI 發展方向的根本轉變。
過去:AI 的角色是「資訊生成器」。
現在:AI 開始成為「任務執行者」。
這意味著:
AI 不只回答問題
AI 開始操作工具
AI 開始管理流程
AI 開始串接服務
AI 開始自主完成任務
而 MCP,正是讓這一切成立的重要基礎。
因為它正在解決大型語言模型最關鍵的問題:
「最後一公里問題」
ChatGPT 或 Claude 很聰明。
但過去它們經常卡在:
無法真正存取資料
無法操作外部工具
無法更新系統
無法完成工作流程
例如:AI 可以幫你寫一篇部落格文章。
但它沒辦法:
登入 WordPress
上傳圖片
更新 SEO 描述
發布文章
整理 Google Sheets
寄送通知信件
現在不同了。
透過 MCP:AI 開始能真正接觸工作環境。
想像一個場景:
我們對 AI 說:
「幫我查看 Notion 裡的品牌名稱草稿,然後到 GoDaddy 搜尋網域是否可用,把可購買的加入清單,再整理到 Google Sheets。」
過去這需要:
打開 Notion
手動複製
搜尋網域
比對結果
開啟 Google Sheets
整理資料
現在:AI 可以直接完成整條流程。
這代表:AI 已經不再只是「輔助工具」。
它開始變成:工作流的執行層。
很多人最近都有一種感覺:
Claude 與 ChatGPT 好像突然進化了。
它們開始擁有工具使用能力。
大型語言模型本身,其實更像是一種推理核心。
真正讓它們變得「像人類工作者」的關鍵,在於:
記憶
工具
工作流
行動能力
這也是目前 OpenAI、Anthropic、Google 等公司競爭的核心。
競爭焦點已經不只是:「誰模型比較聰明?」
反而是:「誰能讓 AI 真正完成事情?」
過去十年,自動化工具的邏輯通常是:
人類建立規則,軟體執行規則。
例如:
IFTTT、Zapier、RPA。
但 MCP 與 AI Agent 的出現,開始改變這件事。
現在變成:
AI 自己理解任務,拆解流程,選擇工具,最後完成執行。
這是一種根本性的差異。
因為:傳統自動化需要明確規則。
但 AI Agent 可以理解模糊目標。
例如:「幫我做一份品牌指南」
這句話本身其實非常抽象。
但 AI 現在已經開始能:
理解需求
分析品牌風格
選擇影像模型
生成設計
迭代修改
甚至能根據結果自我調整。
單一 AI 工具其實並不可怕。
真正強大的,是:多工具協作。
例如,Claude 可以:
讀取網站內容
分析文章主題
呼叫影像生成模型
製作縮圖
上傳 WordPress
更新文章封面
整理資料到 Google Sheets
這種能力,本質上已經接近:「數位員工」。
而這也是 MCP 最重要的地方。
它讓 AI 從單點工具,變成跨平台協作者。
但問題也在這裡。當 AI 開始能:
操作電腦
存取帳戶
使用瀏覽器
管理檔案
執行交易
風險也同步出現。這也是目前 AI Agent 最大的爭議之一。
假設 AI:
誤刪檔案
更新錯誤內容
傳送錯誤資訊
執行錯誤交易
操作錯誤系統
那麼:
責任是誰的?
使用者?
平台?
模型公司?
工具開發者?
這也是目前學術界開始大量討論的:
Human-AI Governance
也就是,人類與 AI 協作時的治理問題。
當 AI 開始擁有行動能力後,問題不再是:「AI 說得對不對?」
進一步要看的是:「AI 做了什麼?」
很多人以為 AI 戰爭是:Claude vs ChatGPT。
但更深層的競爭,其實是:「誰能建立 AI 生態系」
MCP 的重要性就在於:
它不是單一功能。
而是一種平台協議。
這與過去:
App Store
Android
Windows API
其實有點相似。
誰掌握:
工具串接
開發者生態
Agent 工作流
誰就可能掌握下一代 AI 平台。
以上僅供參考與資訊分享之用!若想快速了解更多資訊,透過 AIMochi 筆記工具,幫我們從海量資料中,梳理出關鍵資訊,讓我們精準掌握重要訊息!