/ 中国存储网

EverMemOS 重新定义了 AI 内存的效率

2025-12-31 00:33:23 来源:中国存储网

中国存储网消息,近日,EverMind 发布了其统一的生产级评估框架的结果,旨在评估现实世界的内存表现。

EverMemOS 重新定义了 AI 内存的效率

在这一标准化协议下,公司的引擎EverMemOS在LoCoMo和LongMemEval基准测试中取得了同级最佳成绩,巩固了其作为下一代AI代理领先内存引擎的地位。

现实世界内存评估的开放标准化框架 该评估框架旨在解决人工智能行业的一个关键瓶颈:缺乏一致且透明的内存质量测量方法。当今的智能体依赖于分散的内存工具环境,通常使用不同的数据集和指标进行评估,使得跨系统比较几乎不可能。EverMind的框架建立了一个受控测试环境,在相同条件下对系统进行基准测试,确保分析公平、可重复且可作。在这一严谨的结构下,EverMemOS获得了最高分,建立了长期交互的新性能基准。

EverMemOS背后的架构进展 驱动该系统成功的四大核心技术创新:

  • 分类内存提取:将内存分类为不同的分类法——如情境上下文、语义和用户画像——以解耦信息同时保持语义完整性
  • MemCell原子存储:为每个内存单元嵌入丰富的元数据(时间戳、源代码、标签和关系链),其功能类似于生物内存铭文
  • 活动边界:用主题连续性取代了基于代币的僵硬切割,定义对话中的“事件”,创建可被人类解读的内存片段
  • 多级回忆:采用双系统方法——简单查询时快速检索,复杂任务多跳推理——这与人脑中前额叶皮层与海马体的协作相似

在人工智能内存中树立新标准 这些创新的影响在结果中得到了量化。EverMemOS在LoCoMo上获得了92.3%的得分,交叉评估可重复率为92.32%。

评价

EverMemOS 重新定义了 AI 内存的效率

值得注意的是,EverMemOS 目前是唯一一个在使用全上下文输入时表现优于大型模型的内存系统——而且使用更少的令牌数。这一结果挑战了“背景越多越好”这一普遍假设。评估表明,过多的上下文往往会引入噪音并稀释注意力(“迷失中间”现象)。

EverMemOS 体现了范式转变:高质量的内存不仅需要精确的内存,还需要精确的遗忘。通过作为智能注意力过滤器,系统减轻认知负担,将模型的注意力集中在关键信息上。这将内存从被动档案重新构建为引导推理、塑造身份并实现连续性的主动机制

智能基础设施的未来 

其影响不仅限于基准分数。随着长期内存成为人工智能的基础,它正与模型参数和工具使用并列,成为现代智能基础设施的第三大支柱。未来的客服将从孤立的聊天会话演变成连贯、持续学习的实体,能够维持上下文并建立长期关系。

EverMind发布的该评估框架标志着该领域的转折点。随着人工智能向更深的自主性迈进,强大的长期内存将定义智能系统的新篇章。