AI Agent 的記憶不是日記，是修正迴路

最近看企業 AI agent 的發展，我越來越覺得「記憶」這個詞很容易誤導人。很多人一聽到 agent memory，就直覺想到聊天紀錄、個人偏好、過去對話摘要，好像只要把東西存起來，agent 就會自然變聰明。可是放到企業工作流裡，記憶真正有價值的地方，不是它記得多少，而是它能不能把一次人工修正，變成下一次比較不會再犯的系統行為。

換句話說，AI agent 的記憶不該只是日記。它應該是一個修正迴路。

這個差異很關鍵。日記式記憶的重點是保存：「使用者昨天說過什麼」、「某個任務上次怎麼做」、「這個人偏好什麼格式」。這些當然有用，但它們通常停留在 context 層。下一次 agent 會不會正確使用，取決於模型當下有沒有讀到、讀懂、判斷對。

修正迴路不一樣。它的重點是把錯誤變成規則，把人工介入變成可重複套用的流程。

人工更正是最珍貴的訊號

在企業系統裡，agent 最常犯的錯不一定是大錯。更多時候是一些看似小、但很煩的流程偏差：欄位對錯、分類不準、判斷條件少了一個例外、某種單據要走特殊流程、某個狀態不能直接送出。

如果每次都只是人類在畫面上改掉，然後事情繼續往下走，系統表面上完成了任務，實際上什麼都沒學到。下一次同樣情境出現，agent 還是可能照錯。久了之後，使用者會得出一個很務實的結論：這東西可以幫忙，但不能信任。

技術主管要在意的不是「這次有沒有改對」，而是「這次更正有沒有被系統吸收」。

例如使用者把 agent 自動填的欄位改掉，這裡面其實包含三層訊號：第一，原本的判斷錯了；第二，人類給了一個正確答案；第三，這個修正可能有適用條件。好的 agent 工作流應該把這三層拆出來，而不是只保存最後結果。

從對話記憶到結構化規則

我會把企業 agent 的記憶分成幾種層次。

第一層是原始紀錄：誰在什麼時間做了什麼、agent 原本建議什麼、人類改成什麼。這層主要是追蹤與稽核，不要急著讓 agent 自由解讀。

第二層是結構化差異：哪個欄位被改、從什麼值改成什麼值、當時的輸入條件是什麼、修改理由是否有被標註。這層開始有學習價值，因為它能被統計、查詢、比對。

第三層才是可套用規則：在某些條件下，某欄位應該預設成某值；某類文件需要補某個檢查；某種例外不能自動送出，只能產生草稿或建議。

很多系統會直接從第一層跳到「把紀錄塞進向量資料庫」，然後期待模型下次自己悟出規則。這在 demo 很漂亮，在生產環境通常不夠穩。因為企業工作流需要的是可解釋、可調整、可回滾的行為，不只是語意相似的回憶。

所以我比較喜歡「人類修正 → 結構化事件 → 規則候選 → 審核啟用 → 下次套用 → 留下 trace」這種流程。它慢一點，但邊界清楚。

記憶也需要審批

只要 agent 的記憶會影響未來行為，它就不只是資料，而是設定。甚至可以說，它是一種會自己長出來的商業規則。

這件事不能太隨便。

如果使用者一次修正就立刻變成全域規則，風險很高。那次修正可能只是個案、可能是特例、也可能是使用者自己搞錯。相反地，如果所有修正都只留在 log 裡，永遠不會被整理成規則，那 agent 又學不到東西。

比較健康的做法，是把記憶分成不同成熟度：

觀察中：系統只記錄，不自動套用。
候選規則：多次出現相同修正，提示管理者確認。
局部啟用：先套用在特定流程、特定角色或低風險動作。
正式規則：納入版本管理、稽核紀錄與回滾機制。

這聽起來有點像把 agent 記憶做成 rule engine，但我覺得方向是對的。企業不缺會聊天的模型，缺的是能融入制度、又不把制度搞壞的自動化。

不要讓記憶變成黑盒

記憶最可怕的狀態，是大家知道 agent「好像學過」，但沒有人知道它到底學了什麼。

當 agent 做出一個判斷時，系統應該能回答幾個問題：這次套用了哪一條規則？規則從哪幾次修正來？誰批准的？何時生效？如果錯了，要停用哪一條？

沒有這些問題的答案，agent 記憶很快會變成另一種技術債。表面上越來越聰明，實際上越來越難除錯。尤其在 ERP、BPM、客服、財務、人資這類流程裡，錯誤不是一句「模型幻覺」就能帶過。你要知道它為什麼這樣做，還要能證明它下次不會再這樣做。

這也是為什麼我現在看企業 AI agent，會把「錯誤記憶」和「審計能力」放在很前面。不是因為它們聽起來炫，而是因為這些東西決定 agent 能不能從試用走到日常營運。

結語

AI agent 要進企業工作流，最重要的不是一次答得多漂亮，而是能不能在現場被修正、被約束、被驗證，然後穩定變好。

記憶如果只是日記，它會讓 agent 比較有連續感；但記憶如果能變成修正迴路，它才有機會讓組織真的累積能力。

我會期待未來的企業 agent 平台，不只是提供「記住這件事」的按鈕，而是提供一整套學習治理：記錄修正、抽取規則、人工審批、灰度套用、效果追蹤、錯誤回滾。這些聽起來不浪漫，卻是 AI 真正進入公司流程後最務實的基礎建設。

會記得，不代表會變好。能把錯誤變成下一次的邊界，才是有用的記憶。