最近看企業 AI agent 的發展,我越來越覺得「記憶」這個詞很容易誤導人。很多人一聽到 agent memory,就直覺想到聊天紀錄、個人偏好、過去對話摘要,好像只要把東西存起來,agent 就會自然變聰明。可是放到企業工作流裡,記憶真正有價值的地方,不是它記得多少,而是它能不能把一次人工修正,變成下一次比較不會再犯的系統行為。
換句話說,AI agent 的記憶不該只是日記。它應該是一個修正迴路。
這個差異很關鍵。日記式記憶的重點是保存:「使用者昨天說過什麼」、「某個任務上次怎麼做」、「這個人偏好什麼格式」。這些當然有用,但它們通常停留在 context 層。下一次 agent 會不會正確使用,取決於模型當下有沒有讀到、讀懂、判斷對。
修正迴路不一樣。它的重點是把錯誤變成規則,把人工介入變成可重複套用的流程。
人工更正是最珍貴的訊號
在企業系統裡,agent 最常犯的錯不一定是大錯。更多時候是一些看似小、但很煩的流程偏差:欄位對錯、分類不準、判斷條件少了一個例外、某種單據要走特殊流程、某個狀態不能直接送出。
如果每次都只是人類在畫面上改掉,然後事情繼續往下走,系統表面上完成了任務,實際上什麼都沒學到。下一次同樣情境出現,agent 還是可能照錯。久了之後,使用者會得出一個很務實的結論:這東西可以幫忙,但不能信任。
技術主管要在意的不是「這次有沒有改對」,而是「這次更正有沒有被系統吸收」。
例如使用者把 agent 自動填的欄位改掉,這裡面其實包含三層訊號:第一,原本的判斷錯了;第二,人類給了一個正確答案;第三,這個修正可能有適用條件。好的 agent 工作流應該把這三層拆出來,而不是只保存最後結果。
從對話記憶到結構化規則
我會把企業 agent 的記憶分成幾種層次。
第一層是原始紀錄:誰在什麼時間做了什麼、agent 原本建議什麼、人類改成什麼。這層主要是追蹤與稽核,不要急著讓 agent 自由解讀。
第二層是結構化差異:哪個欄位被改、從什麼值改成什麼值、當時的輸入條件是什麼、修改理由是否有被標註。這層開始有學習價值,因為它能被統計、查詢、比對。
第三層才是可套用規則:在某些條件下,某欄位應該預設成某值;某類文件需要補某個檢查;某種例外不能自動送出,只能產生草稿或建議。
很多系統會直接從第一層跳到「把紀錄塞進向量資料庫」,然後期待模型下次自己悟出規則。這在 demo 很漂亮,在生產環境通常不夠穩。因為企業工作流需要的是可解釋、可調整、可回滾的行為,不只是語意相似的回憶。
所以我比較喜歡「人類修正 → 結構化事件 → 規則候選 → 審核啟用 → 下次套用 → 留下 trace」這種流程。它慢一點,但邊界清楚。
記憶也需要審批
只要 agent 的記憶會影響未來行為,它就不只是資料,而是設定。甚至可以說,它是一種會自己長出來的商業規則。
這件事不能太隨便。
如果使用者一次修正就立刻變成全域規則,風險很高。那次修正可能只是個案、可能是特例、也可能是使用者自己搞錯。相反地,如果所有修正都只留在 log 裡,永遠不會被整理成規則,那 agent 又學不到東西。
比較健康的做法,是把記憶分成不同成熟度:
- 觀察中:系統只記錄,不自動套用。
- 候選規則:多次出現相同修正,提示管理者確認。
- 局部啟用:先套用在特定流程、特定角色或低風險動作。
- 正式規則:納入版本管理、稽核紀錄與回滾機制。
這聽起來有點像把 agent 記憶做成 rule engine,但我覺得方向是對的。企業不缺會聊天的模型,缺的是能融入制度、又不把制度搞壞的自動化。
不要讓記憶變成黑盒
記憶最可怕的狀態,是大家知道 agent「好像學過」,但沒有人知道它到底學了什麼。
當 agent 做出一個判斷時,系統應該能回答幾個問題:這次套用了哪一條規則?規則從哪幾次修正來?誰批准的?何時生效?如果錯了,要停用哪一條?
沒有這些問題的答案,agent 記憶很快會變成另一種技術債。表面上越來越聰明,實際上越來越難除錯。尤其在 ERP、BPM、客服、財務、人資這類流程裡,錯誤不是一句「模型幻覺」就能帶過。你要知道它為什麼這樣做,還要能證明它下次不會再這樣做。
這也是為什麼我現在看企業 AI agent,會把「錯誤記憶」和「審計能力」放在很前面。不是因為它們聽起來炫,而是因為這些東西決定 agent 能不能從試用走到日常營運。
結語
AI agent 要進企業工作流,最重要的不是一次答得多漂亮,而是能不能在現場被修正、被約束、被驗證,然後穩定變好。
記憶如果只是日記,它會讓 agent 比較有連續感;但記憶如果能變成修正迴路,它才有機會讓組織真的累積能力。
我會期待未來的企業 agent 平台,不只是提供「記住這件事」的按鈕,而是提供一整套學習治理:記錄修正、抽取規則、人工審批、灰度套用、效果追蹤、錯誤回滾。這些聽起來不浪漫,卻是 AI 真正進入公司流程後最務實的基礎建設。
會記得,不代表會變好。能把錯誤變成下一次的邊界,才是有用的記憶。