AI memory 大賽覆蓋技術(shù)應(yīng)用到基礎(chǔ)設(shè)施全層

2026-03-04 16:24 互聯(lián)網(wǎng)

　　在大模型能力突飛猛進(jìn)的這兩年里，行業(yè)幾乎把所有注意力都集中在參數(shù)規(guī)模、多模態(tài)、推理能力和算力效率上。

　　但在真實應(yīng)用中，開發(fā)者很快發(fā)現(xiàn)了一個殘酷事實：模型會“忘事”。

　　無論是對用戶偏好的理解、對歷史決策的追溯，還是跨時間跨度的復(fù)雜推理，只要上下文窗口結(jié)束，一切都得從頭來過。RAG可以緩解一部分問題，但它更像是“臨時查資料”，而不是“真正記住”。

　　如果說大模型負(fù)責(zé)“思考”，那么記憶系統(tǒng)決定的，其實是智能體是否具備連續(xù)自我。

　　鄧亞峰認(rèn)為，“如果模型每次會話后都會重置理解，真正的Agentic AI就無從談起。”

　　EverMind正在從靜態(tài)的上下文窗口邁向動態(tài)、自組織的記憶，借助EverMemOS，為智能體提供了一段“活的、會演化的歷史”。

　　基準(zhǔn)結(jié)果表明：EverMind能夠以遠(yuǎn)低于全上下文模型的算力成本，實現(xiàn)更高的準(zhǔn)確率。

　　正是在這一判斷下，EverMind把研發(fā)重心從模型能力本身，轉(zhuǎn)向了一個更底層，也更難的方向——AI Memory Infra。

　　EverMemOS：打破行業(yè)基準(zhǔn)，點擊即用

　　在EverMind最新發(fā)布的論文EverMemOS： A Self-Organizing Memory Operating System for Structured Long-Horizon Reasoning中，團(tuán)隊對現(xiàn)有主流方案進(jìn)行了清晰區(qū)分。

　　截圖來源：EverMemOS： A Self-Organizing Memory Operating System for Structured Long-Horizon Reasoning

　　EverMind詳細(xì)闡述了其技術(shù)提出的一套受engram啟發(fā)的生命周期機(jī)制，用以模擬生物認(rèn)知過程。與傳統(tǒng)RAG或成本高昂的超長上下文窗口不同，EverMemOS能將經(jīng)驗組織為連貫、可演化的結(jié)構(gòu)。

　　它試圖構(gòu)建的，是一個類似生物認(rèn)知系統(tǒng)的記憶生命周期，靈感直接來自神經(jīng)科學(xué)中的engram理論。

　　在這套架構(gòu)中，記憶不是靜態(tài)存儲，而是會被不斷壓縮、重組、強(qiáng)化和遺忘的動態(tài)系統(tǒng)。

　　EverMemOS的核心機(jī)制，被概括為三個連續(xù)但可循環(huán)的階段。

　　第一階段：情景痕跡形成（Episodic Trace Formation）。

　　將對話流轉(zhuǎn)換為MemCells，用于捕捉情景痕跡、原子事實以及有時間邊界的前瞻信息。

　　第二階段：語義鞏固（Semantic Consolidation）。

　　把MemCells動態(tài)組織為主題化的MemScenes，提煉穩(wěn)定的語義結(jié)構(gòu)，并持續(xù)更新持久化的用戶畫像。

　　第三階段：重建式回憶（Reconstructive Recollection）。

　　通過agentic檢索組合“必要且充分”的推理上下文，在優(yōu)化算力成本的同時保證高準(zhǔn)確率。

　　這也是EverMemOS能在大幅降低token消耗的同時，維持甚至提升準(zhǔn)確率的關(guān)鍵。

　　基準(zhǔn)成績，是硬指標(biāo)

　　在AI基礎(chǔ)設(shè)施領(lǐng)域，架構(gòu)是否成立，最終要看基準(zhǔn)測試。

　　EverMind在四個主流記憶評測基準(zhǔn)上，給出了極具說服力的數(shù)據(jù)。

　　LoCoMo（93.05%準(zhǔn)確率）：超越全部現(xiàn)有記憶系統(tǒng)與全上下文模型；在多跳推理（+19.7%）與時序任務(wù)（+16.1%）上優(yōu)勢顯著，同時大幅降低token使用與計算成本。

　　LongMemEval（83.00%準(zhǔn)確率）：在知識更新與時序推理方面位居第一；其中知識更新任務(wù)提升20.6%，體現(xiàn)出系統(tǒng)可通過持續(xù)語義鞏固不斷“進(jìn)化”的能力。

　　HaluMem（90.04%召回）：在記憶完整性方面建立新的行業(yè)標(biāo)準(zhǔn)，顯著減少長時程任務(wù)中的幻覺。

　　PersonaMem v2：在9個復(fù)雜場景中，在深度個性化與行為一致性維度取得最佳綜合表現(xiàn)。

　　這說明EverMind不需要犧牲效率，去換取長期記憶。結(jié)構(gòu)本身，就是效率。

　　從論文到云服務(wù)：記憶能力的產(chǎn)品化

　　如果EverMemOS只停留在論文階段，它的意義仍然是學(xué)術(shù)層面的。

　　但是，EverMind顯然希望更快地進(jìn)入真實應(yīng)用場景。

　　此次同步推出的EverMemOS Cloud Service，正是為開發(fā)者和企業(yè)提供“即插即用”的記憶增強(qiáng)能力。通過簡單API調(diào)用，原本無狀態(tài)的聊天機(jī)器人，可以在數(shù)分鐘內(nèi)升級為具備長期上下文感知的智能體。

　　在設(shè)計上，該云服務(wù)強(qiáng)調(diào)三點：

　　一是企業(yè)級數(shù)據(jù)安全與隱私隔離；

　　二是對底層記憶架構(gòu)的自動迭代；

　　三是盡可能降低開發(fā)者的使用門檻。

　　目前，該服務(wù)已對候補(bǔ)名單（waitlist）用戶開放內(nèi)測，也可以通過官網(wǎng)申請加入內(nèi)測：console.evermind.ai。

　　Memory Genesis：把基礎(chǔ)設(shè)施交到生態(tài)手里

　　與產(chǎn)品發(fā)布同樣重要的，是EverMind對生態(tài)的態(tài)度。

　　Memory Genesis Competition 2026，并不想做成一次常規(guī)的應(yīng)用開發(fā)大賽，而是圍繞“記憶原生應(yīng)用”展開的系統(tǒng)性共創(chuàng)。

　　圖片來源：EverMind

　　賽事設(shè)置了Memory+Agent、Plugin和Infra三大賽道，覆蓋從應(yīng)用到基礎(chǔ)設(shè)施的不同層級。初始獎金池為8萬美元，并提供后續(xù)收入分成與職業(yè)機(jī)會。

　　優(yōu)秀開發(fā)者不僅能獲得獎金，還可能直接進(jìn)入EverMind工程團(tuán)隊，或獲得長期技術(shù)支持。

　　開發(fā)者可在2月線上參賽并提交作品，3月份將在社區(qū)逐步公布優(yōu)秀項目，并將邀請優(yōu)秀團(tuán)隊參加4月初在硅谷舉辦的線下活動。

　　開發(fā)者可在evermind.ai/activities注冊。

相關(guān)閱讀

»延伸閱讀: 2025年第三季度：江蘇光伏概念股管理費用前; 華為昇騰一體機(jī)概念上市公司10強(qiáng)：2025年第; 【OLED面板概念股】2025年第三季度管理費用; 2025年第三季度：基因芯片概念上市公司管理; 保健品股票管理費用十大排名（2025年第三季

»要聞導(dǎo)讀: 市場營銷渠道包括哪些; 平均固定成本的計算公式; 什么是貨幣乘數(shù) 貨幣乘數(shù)的計算公式; 投入預(yù)算是什么; 2023海帶行業(yè)發(fā)展現(xiàn)狀如何

官方微信

財經(jīng)專區(qū)

相關(guān)導(dǎo)讀