在日常生活中,人類幾乎每分鐘都在做一件事:根據新資訊調整自己的判斷。
如果你正在規劃旅行,一開始可能認為「時間最重要」。
但當你看到價格差距很大時,可能會突然改變想法:「其實便宜比較重要。」
這種行為看似理所當然,但對於現代大型語言模型(LLM)來說,卻是一個極為困難的能力。
即使是目前最強大的模型,例如
Gemini
GPT‑4
LLaMA
在某些情況下仍然無法像人類一樣 逐步更新信念(belief updating)。
這個問題長期困擾 AI 研究界。
而最近,Google 的研究團隊提出了一個可能的解決方案:讓 AI 學習「機率推理」。
這項突破,正好與另外兩個重大趨勢同時出現:
AI 開始能在 手機端運行
AI 開始能 自主完成整個專案
這三條技術路線交織在一起,正在形成一個新的 AI 時代。筆者透過 AIMochi 筆記工具,來看看 AI 圈的最新近況!
大型語言模型之所以強大,是因為它們可以模仿語言模式。
透過訓練數以兆計的文字資料,模型能夠:
撰寫文章
生成程式碼
翻譯語言
回答問題
但研究人員發現一個奇怪的現象:模型在互動中往往無法持續學習。
在一項實驗中,研究人員設計了一個簡單的情境:AI 需要幫使用者推薦航班。
每個航班都有不同特徵,例如:
價格
飛行時間
轉機次數
AI 的任務是觀察使用者選擇,推測對方的偏好。
理論上,如果使用者多次選擇「最便宜」的航班,AI 應該逐漸理解:
這位使用者重視價格。
然而實驗結果卻顯示:
大部分模型只在第一次互動後略微改善,之後就停止學習。
研究人員將這種現象稱為:
「一次性平台期(one-shot plateau)」
換句話說,AI 在理解使用者方面幾乎沒有持續進步。
為了理解理想的學習方式,研究人員將語言模型與另一種系統進行比較。
這種系統並不是神經網路,而是一個數學模型:
貝葉斯推理的核心概念是:
每當有新證據出現,就更新機率分布。
舉例來說:
如果 AI 一開始認為:
使用者重視價格:50%
使用者重視時間:50%
當使用者多次選擇便宜航班後,機率會逐漸變成:
價格:80%
時間:20%
這種方法在統計學與機器學習領域已經使用數十年。
令人驚訝的是:這種簡單的數學模型,表現比大型語言模型更好。
研究團隊提出了一個巧妙的方法。
他們並沒有直接教模型答案,而是讓模型學習:
如何進行推理。
這種方法被稱為:
Bayesian Teaching
傳統 AI 訓練方式是:
老師知道答案
→ 模型模仿答案
而在新方法中:
老師也可能不知道最終答案。
但老師會展示:
推理過程
假設更新
機率變化
研究團隊將這些資料用於 監督式微調(Supervised Fine-Tuning)。
訓練對象包括:
Gemma
LLaMA
結果非常驚人。
模型與最佳貝葉斯策略的吻合度達到:約 80%
更重要的是,模型開始展現真正的 信念更新行為。
研究人員進一步測試模型的泛化能力。
新的測試包括:
飯店推薦
電子商務商品選擇
更多決策變數
令人意外的是:
模型在某些情境下 甚至超越人類參與者。
原因其實很簡單。
人類並不是完全理性的決策者。
我們常常:
分心
改變主意
行為不一致
而經過數學推理訓練的 AI,反而更接近「理性決策模型」。
這顯示一個重要方向:
AI 未來可能結合神經網路與符號推理。
與此同時,Google 也在解決另一個問題:
如何讓 AI 直接在手機上運行。
為此,Google 推出了:
TensorFlow 2.21 以及新的推理引擎 LiteRT
LiteRT 是過去 TensorFlow Lite 的升級版本。
它的目標是:
讓 AI 在小型設備上運行得更快。
改進包括:
GPU 推理速度提升約 1.4 倍
更好的 NPU 支援
更簡單的模型部署流程
手機運行 AI 最大問題是:
記憶體
電力
計算能力
解決方法之一是:
模型量化(Quantization)
簡單來說,就是:
把高精度數字壓縮成更小格式。
這樣可以:
減少模型大小
提高運行速度
降低耗電
結果是:
更大的 AI 模型可以在手機端運行。
這意味著未來很多 AI 功能將不需要雲端。
除了推理能力與裝置端 AI,另一個快速崛起的領域是:
AI Agent
近期,ByteDance 發布了開源框架:
DeerFlow
這個系統的核心概念是:
多代理協作
一個任務可以被拆分為多個子任務:
例如:
收集資料
分析數據
生成圖表
製作簡報
不同代理同時工作,最後合併結果。
更重要的是:
DeerFlow 代理可以:
運行程式碼
執行命令列
存取檔案
換句話說:
AI 不只是建議,而是 真正執行任務。
同時,NVIDIA 正準備推出企業代理平台:
NemoClaw
該平台預計在 NVIDIA GTC 開發者大會公布。
根據媒體報導,NemoClaw 的目標是:
讓企業部署能替員工工作的 AI 代理。
可能合作公司包括:
Salesforce
Cisco
Adobe
平台將強調:
安全性
隱私控制
企業級部署
這顯示 AI 正逐漸從工具變成:勞動力。
過去幾年,大多數人認為 AI 的未來是:
聊天機器人。
但現在的發展方向顯示另一種可能:
AI 將逐漸變成一種 工作系統。
它能:
推理
執行任務
自主完成專案
當這三項能力結合時,一個新的經濟模式可能出現:
AI Agent Economy
在這個世界裡,企業不只是雇用人類。
還會雇用:
人工智慧代理。
而這場變革,或許才剛剛開始。
以上僅供參考與資訊分享之用!若想快速了解更多資訊,透過 AIMochi 筆記工具,幫我們從海量資料中,梳理出關鍵資訊,讓我們精準掌握重要訊息!