这是一次关于AI记忆的深度对话。随着大模型落地进入深水区,记忆成为企业AI不可绕开的议题。不过,市场对记忆的认知仍然较为浅显——有人将其视为基模的一部分,有人将其等同于RAG工程化的一环,记忆在企业AI基础设施中的位置与价值尚未形成共识。为厘清这一概念和本质,追踪最新的行业实践和落地进展,爱分析与质变科技创始人占超群进行了深度交流。质变科技定位为独立于基模的记忆基础设施提供商,核心产品覆盖企业级决策轨迹、记忆计算、多模态理解等能力,目前服务金山办公、国投,以及运营商、玩具公司等不同类型客户。在此次访谈中,占超群分享了他对记忆本质、记忆与基模的关系、决策轨迹,以及记忆与知识库/RAG的本质区别、B端与C端的差异、商业化落地等核心话题的系统思考。
核心观点记忆是智能体进化的基础设施。
大模型提供的是通用思考力,记忆提供的是可持续积累的经验、事实、偏好、决策轨迹与环境状态。一个真正有用的AI,需要思考力与记忆力协同。没有记忆,AI很容易停留在一次性问答。决策轨迹型记忆是企业AI的关键突破口。
企业真正稀缺的往往不是文档本身,而是“为什么这么做”的过程性经验。记忆层要在授权、权限和治理边界内,把组织运行中被验证过的审批依据、处理路径、异常判断与复盘反思,沉淀为可参考、可复用、可演化的最佳实践,让经验随业务持续迭代,而不是依赖零散口耳相传。RAG会被记忆层内化为一个检索原语。
RAG作为检索增强生成的范式非常重要,但它更多解决“从外部资料找相关内容”的问题。企业级记忆要解决的是长期状态、动态写入、多源冲突、版本溯源、决策轨迹、权限安全和近数据计算。因此,未来RAG不会消失,但会成为记忆层中的一个能力,而不是完整答案。企业记忆需要中立、可携带、跨模型。
模型可以迭代、切换、组合使用,但企业和个人的记忆不应被锁死在某一个模型生态里。我们认为未来会出现类似“记忆护照”的形态:One Memory, One Truth。记忆跟人、组织和业务过程走,而不是跟某一代模型走。做好记忆基础设施,需要三位一体的能力。
第一是专属的数据理解模型,尤其是文档、表格、图片、音频、视频等多模态理解;第二是多模态数据平台与存储表征能力;第三是记忆管理与记忆计算能力,包括压缩、召回、版本、冲突、血缘、权限、代码执行与任务级上下文构建。
以下为本次访谈实录,在不改变原意基础上略有修改。
01、记忆独立于模型,是AI进化的基础
爱分析:对于记忆,业内认知还比较浅,理解也不太一样。从infra这层来讲,记忆和基模之间是什么关系?各自边界在哪里?占超群:我倾向于把它们理解成AI系统里的两类基础能力:基模主要提供“思考力”,记忆主要提供“进化所依赖的状态”。思考力解决的是模型能不能推理、规划、泛化和调用工具;记忆解决的是系统能不能长期记住事实、经验、偏好、决策过程以及环境变化。从计算机系统的类比看,模型参数更像一种长期压缩过的通用知识,当前上下文更像工作内存,而企业记忆更接近一套面向AI的持久化状态层。它不是把数据简单存起来,而是要能被AI理解、调用、更新、校验和治理。所以边界大致是:基模负责通用智能与推理,记忆层负责企业专属状态与经验积累。二者不是替代关系,而是乘法关系。模型再强,如果没有持续积累的企业上下文,就容易停留在“瞬时聪明”;记忆再丰富,如果没有足够强的模型去理解和推理,也只是静态资料库。
爱分析:如果要实现自进化,思考力和记忆力分别要做到什么程度?它们之间是怎么互相提升的?占超群:自进化不是一个口号,它至少要求两件事同时成立。第一,思考力要足够强。它要支持长程推理、复杂任务分解、工具调用、低幻觉输出,以及对不确定性的判断。尤其在企业生产力场景里,AI不只是回答问题,还要能解释为什么这么做、下一步怎么做、风险在哪里。第二,记忆力要足够可靠。它不仅要能保存已有知识,还要能理解外部数据、沉淀过程经验、识别冲突、形成版本,并在合适的时机召回。记忆不是存得越多越好,而是要在任务发生时构造出足够精炼、足够完整、足够可信的上下文。两者的关系是互相增强的。模型通过推理把工作过程中的经验抽象为记忆;记忆又反过来为模型下一次推理提供事实依据、历史案例和组织偏好。智能体之所以能越来越聪明,本质上依赖这个闭环,而不是单次问答能力的线性叠加。
爱分析:对于企业用户来讲,是否存在两个记忆体——大模型内部有,企业自己内部也有一个统一的记忆?占超群:可以这么理解,但我会更谨慎地表述为:模型内部确实会有某种产品级或用户级的记忆能力,但企业真正需要的是一份可治理、可携带、可审计的统一记忆。在企业侧,我们通常从两个视角建设记忆。第一是岗位或角色视角,也可以理解为“工作脑”。这里关注的是岗位场景中的可复用方法,而非个人表现本身。审批依据、异常处理路径、客户响应边界、代码评审关注点等,背后都有组织在真实业务中反复验证过的处理逻辑。员工经验本身应当被尊重;记忆层做的是在授权和治理前提下,沉淀其中可共享、可复用、可审计的部分,形成组织最佳实践,让新人少走弯路,也让团队在同一事实和方法框架下协作。第二是企业整体视角。以售后场景为例,一个产品从定义、研发、测试、文档、培训、交付到客户反馈,中间每个环节都会产生信息损耗。客户最后提出一个问题时,如果AI只看售后文档,往往离真实原因很远。企业级记忆要把代码、产品定义、测试记录、培训材料、安装记录、工单反馈等串起来,形成公司级连续记忆,让AI能沿着链路追溯问题根因。
爱分析:听起来,记忆是要把数据拉通之后,进一步去挖掘里面的隐性知识。它跟过去我们提的数据中台有什么本质区别?是不是在传统数据治理之上多了一层?占超群:我不认为它只是“多了一层”。传统数据中台主要解决的是数据资产的集中、治理和服务化问题,但它面对的是一个相对静态的世界:字段、表、指标、标签、权限、报表。它很重要,但它并不天然等于AI记忆。AI记忆有两个本质差异。第一,它是以问题和使用者为中心实时组织上下文,而不是以数据资产本身为中心。过去做数据中台的人和业务使用者往往不是同一批人,中间存在天然语义断层。今天有了大模型,系统可以围绕一个具体问题去理解、查找、重组和验证信息,形成任务级上下文。第二,它把大量过去无法有效治理的非结构化经验纳入进来。企业真正高价值的信息大量存在于文档、邮件、会议、聊天、代码、图片、视频、工单和人的操作轨迹里。没有大模型之前,这些信息很难被结构化、关联和复用;今天这件事开始可行。所以,数据中台更多解决“数据能不能被管”;记忆层解决“经验能不能被AI理解、复用、演化”。这是两代基础设施的差异。
爱分析:现在上下文窗口越来越大,Gemini都做到200万token了,很多人会问:全塞进上下文不就行了,为什么还要一个独立的记忆层?占超群:这是当前很常见的误解。长上下文非常重要,它解决的是“这一次能看多少”。但记忆层解决的是“长期能不能记住、能不能更新、能不能治理、能不能复用”。这两件事不能混为一谈。我经常用一个朴素类比:上下文窗口是内存,记忆是硬盘,不能因为内存条变大了,就把硬盘扔了。企业更不会因为某一代模型支持更长上下文,就放弃自己的数据资产和决策资产。原因至少有三个。第一,上下文是一次性工作内存,记忆是跨会话、跨任务、跨模型的持久状态。会话结束以后,上下文不应成为企业长期经验的唯一载体。第二,上下文按token消耗,企业不可能每次都把几十GB甚至TB级数据重新塞给模型。更合理的方式是由记忆层按任务需要构建精炼上下文,并在数据附近完成一部分计算。第三,长上下文不等于高质量召回。窗口越长,噪声也越多,关键事实可能被淹没。真正可靠的系统需要检索、排序、压缩、溯源、冲突识别和权限控制,而不是简单“全塞进去”。
02、AI眼里的好记忆是决策轨迹
爱分析:员工的工作脑记忆里边,一个是任务执行,类似于SOP记忆,这种记忆有规范、标准,好和不好是有概念的;但另外一种,纯粹经验层面的,如处理事情的方法和思路,那么AI怎么去判断它是一个好的知识?AI能自己识别吗?占超群:这里要先把“好知识”这个概念拆开。企业里很多经验不是简单的对错题,而是条件题。某个审批为什么通过,某个客户为什么特殊处理,某个财务异常为什么没有按标准流程走,背后往往取决于上下文、约束条件、历史惯例和风险偏好。我们现在重点做的方向叫决策轨迹。它不是简单记录“做了什么”,更不是把个人经验机械复制成模板,而是记录“为什么这么做”:当时看到哪些证据,遵循了哪些规则,权衡了哪些风险,最终由谁做了判断。它本质上是把人和组织在真实业务中被验证过的过程性经验,结构化为可参考、可复用、可演化的记忆。AI能做初步识别,比如从过往工单、邮件、审批和会议记录里抽取决策链,找出相似案例,判断某个处理是否符合历史模式。但在高价值或高风险场景里,AI不应独自定义什么是“好”。更合理的做法是:AI负责发现、归纳、对比和提示,人负责确认边界、合规性和例外条件。以财务场景为例,绝大多数规则性动作可以逐步自动化,但最关键的一小部分往往是需要经验判断的异常场景。记忆层要支持的恰恰是这部分:当规则不够用时,为人提供可追溯的历史案例、约束条件和参考路径,辅助人做出更稳健的最终判断。
爱分析:这个收敛的过程是因人而异的、一人一个工作脑,还是说当决策轨迹足够多以后,由AI自己去总结出一套通用的最佳实践?占超群:两者都会发生,但顺序很重要。我们通常先从一条条具体行为开始,把它还原成决策链记忆:输入是什么,判断过程是什么,行动是什么,结果是什么,后续有没有复盘。当决策链积累到一定规模以后,系统可以做聚类、归纳和对比,形成“在某类条件下通常怎么处理”的经验模型。但我不会轻易说它就是绝对最佳实践。企业场景里更准确的说法是“在特定约束下被验证过的高置信实践”。当新人或接手同类任务的成员处理一个审批或工单时,系统会先找相似决策轨迹,展示过去怎么做、为什么这么做、结果如何。人可以参考既有路径,也可以基于新情况提出新的判断。新的判断如果在后续被验证有效,就会进入候选记忆并形成新的高置信实践。这样,系统不是一次性训练出一个固定SOP,而是在持续工作中帮助组织实践不断演化。
爱分析:那这些决策链里的审批节点,是需要人工去预设好,还是说AI在读取数据后,自己去不断挖掘和提炼出新的节点?占超群:实际上是人机结合。企业里有一部分节点本来就是显性的,比如OA流程、审批流、工单状态、财务规则、代码评审节点,这些可以直接继承。还有一部分节点是隐性的,比如“这个客户为什么被特殊处理”“这个异常为什么暂缓”“这个风险为什么被放大”,这些需要AI从上下文里挖掘。AI的价值在于发现那些没有被流程系统明确定义、但真实影响决策的中间变量。比如一封邮件里的语气、一次会议里的承诺、历史工单中的反复故障、某个客户的特殊SLA,这些都可能成为决策节点。但节点被挖掘出来以后,需要有治理机制。它可以先作为低置信度候选记忆,经过业务人员确认、后续结果验证,再进入高置信度记忆。企业AI不能只追求自动化,还必须追求可解释和可控。
爱分析:日常工作中,还会不断有新的决策轨迹堆叠,哪些要堆上去,哪些没那么合理,需要持续有人去判断?占超群:是的,这就是记忆堆叠和记忆治理。记忆和知识库一个很大的区别在于:知识库通常是静态写、静态读;记忆是动态写、动态读,而且需要不断修正。在实践中,我们会给记忆设置多维度的置信机制:来源是否可靠、是否被多人确认、是否有结果反馈、是否与现有规则冲突、是否近期仍有效、是否属于例外情况。不是所有新行为都应该立刻成为组织记忆,也不是所有历史经验都应该永远有效。人仍然在闭环里。对于高风险场景,新的决策轨迹可以先进入候选区,由负责人确认;对于低风险场景,系统可以先形成低置信候选记忆,再通过结果反馈、多人确认或后续复盘逐步提升置信度。记忆系统可信的前提,不是它永远不犯错,而是每条记忆都能被查、被改、被撤回。
爱分析:也就是说,记忆有很多分支版本?占超群:对。企业记忆有点像Git,不是一个永远只有单一版本的文本库,而是一个可以多人协作、多分支演化、可合并、可回滚的状态系统。以报价为例,定价表里写过一个价格,销售会议讨论过另一个价格,老板在聊天里又给过一个特殊授权。AI不能简单取一个平均值,也不能随便相信最新一句话。它需要知道每个事实来自哪里,谁说的,何时说的,适用于哪个客户,是否被确认过,是否已经过期。这就是版本、血缘和冲突管理的意义。最终业务负责人可以明确说:这个客户以我在某次正式沟通中确认的版本为准。系统就会把这次确认作为新的高置信记忆,同时保留旧版本和适用范围。没有这套机制,记忆就会变成更危险的“自信错误”。
爱分析:记忆跟知识库有哪些区别?占超群:我会从五个维度区分。第一,知识库以文档和条目为中心,记忆以任务、实体、事件和决策轨迹为中心。第二,知识库通常是只读或弱写入,记忆必须支持读写、更新、冲突处理和版本演化。第三,知识库主要解决检索问题,记忆还要解决“什么时候该记、该忘、该合并、该覆盖、该提醒”的生命周期问题。第四,知识库较少处理跨系统过程经验,而记忆要把邮件、会议、代码、工单、报表、审批、数据库等多源信息组织成连续上下文。第五,企业记忆必须内置权限、安全、溯源和近存储计算。它不仅要回答“答案是什么”,还要回答“依据是什么、谁能看、是否过期、能不能回滚”。所以,知识库是记忆层里的重要组成,但不等于记忆层。
爱分析:日常需要跟记忆去交互的,涉及所有的企业内部相关系统?占超群:从最终形态看,是的。因为企业AI要解决真实问题,就不可避免地要连接真实系统:OA、IM、邮件、CRM、ERP、代码仓库、数据仓库、工单系统、知识库、文档系统、会议系统等。但这不是简单“全部打通”。企业记忆需要一套统一的连接、索引、权限和审计机制。每接一个系统,都要回答几个问题:哪些数据可以进入记忆,谁有权看,哪些信息只能作为计算依据不能暴露,哪些记忆可以写回,哪些动作需要审批。未来的数据技术会出现一个面向AI的记忆infra。它不只是服务搜索,而是服务智能体的长期任务执行。否则AI很难真正进入生产力核心环节。
03、为什么记忆难做?需要专属模型、多模态能力、记忆管理和计算能力
爱分析:记忆作为基础设施一部分,消耗的算力应该比应用还要多?占超群:在重型企业场景里,经常会是这样,但也要看任务类型。记忆的算力不是只发生在问答时,而是发生在全生命周期:数据接入、文档解析、多模态理解、结构化抽取、索引构建、摘要压缩、版本比对、冲突检测、权限计算,以及任务执行时的近存储计算。尤其是我们做的很多客户,文档不是几十页,而是几千页、几十万页;数据也不是单一文本,而是PDF、Word、Excel、图片、音频、视频、代码和数据库混在一起。如果前面的理解错了,后面的记忆和推理都会错,这就是Garbage in, Garbage out。所以,在高准确率生产力场景里,记忆infra的计算投入往往不低于应用层,甚至更高。
爱分析:这样的话,以记忆为中心的基础设施,和以思考力或者说以模型计算为核心的基础设施,是完全独立的两套体系?占超群:我不认为它们是完全独立的两套体系,更准确地说,是两类相对独立、但高度耦合的基础设施。模型计算负责推理、规划、生成和工具调用;记忆计算负责数据理解、状态管理、召回、压缩、溯源、冲突、权限和近数据执行。两边都需要模型,也都需要算力,但关注点不同。如果思考力弱,AI做复杂任务的规划和推理能力会不足;如果记忆力弱,AI的任务成功率、上下文一致性和可信度会不足。企业最终买的不是单点能力,而是“能不能稳定完成任务”。从这个角度看,思考力和记忆力缺一不可。
爱分析:模型厂商为什么不能同时做模型和记忆?为什么只会侧重于思考力?占超群:模型厂商当然可以做记忆,而且已经在做。但企业级独立记忆层仍然有存在价值,原因主要有三点。第一是中立性。企业不会希望自己的长期记忆被绑定在某一个模型里。今天用GPT,明天用Claude,后天用Gemini或国产模型,这很正常。模型可以换,但企业记忆最好只有一份。记忆跟人和组织走,而不是跟模型供应商走。第二是治理边界。模型厂商的产品型记忆更多面向用户体验和个性化,企业记忆面对的是权限、安全、审计、合规、血缘、版本、冲突、私有化部署和信创适配。这些不是“记住用户偏好”能覆盖的。第三是技术栈差异。做好企业记忆,需要很强的数据理解模型、多模态数据平台、记忆管理和记忆计算能力。给你一个几千页PDF、几十个 Excel、若干会议纪要和多套数据库,系统要理解版式、表格、图像、实体、时间线、业务语义和决策链。这件事不是在聊天产品里加一个memory功能就能解决的。
爱分析:但现在模型厂自己都在做记忆了,OpenAI上个月刚发了Dreaming V3,谷歌有Personal Context,Claude也全量开了记忆。它们自带的记忆,和你们这种独立记忆层到底差在哪?占超群:我认为这恰恰证明了记忆正在成为AI的核心能力。无论厂商具体叫什么版本,方向都很清楚:AI不能只靠一次性上下文,必须具备长期个性化和持续状态。但模型厂商自带记忆和企业独立记忆层的边界还是明显的。第一,所有权和可携带性不同。产品型记忆通常跟随某个模型或某个应用生态,企业级记忆需要跨模型、跨应用、跨系统。用户真正希望的是“一份记忆,多处可用”。第二,准确性和治理要求不同。消费级记忆记错一句偏好,通常只是体验问题;企业记忆记错一个报价、权限、审批依据或客户承诺,可能就是经营事故。第三,能力深度不同。企业级记忆要处理多源数据、实体级权限、冲突管理、血缘溯源、版本回滚、私有化部署、信创环境和近存储计算。模型黑盒里的记忆通常很难让企业审计每一条记忆从哪来、为什么生效、如何撤销。所以,我们不是否定模型厂商做记忆,而是认为:模型厂商做的是产品体验层的记忆,企业还需要一层中立、可治理、可携带的记忆基础设施。
爱分析:记忆是一套独立的计算能力?占超群:是的。记忆不只是被检索的对象,它本身也要具备计算能力。举个账单分析的例子。AI首先会search memory,找到与账单相关的合同、邮件、发票、审批、历史付款记录和异常说明。接下来它不会把所有原始材料都塞进大模型,而是在记忆层里做筛选、聚合、计算、比对和溯源,只把关键证据和结果交给模型继续推理。这就是近存储计算。随着企业数据规模越来越大,未来很多计算逻辑会从模型侧下沉到记忆侧。大模型负责提出问题和规划路径,记忆引擎负责在数据附近执行计算、返回可信证据。
爱分析:这里边的步骤是AI自主规划的?占超群:是由模型的思考力来规划,但不是不受约束的自由发挥。一个可靠的企业智能体,应该在记忆系统提供的工具、权限、数据目录和安全策略内做规划。它会不断问记忆:有哪些相关数据,哪些证据可信,哪些信息冲突,哪些结果需要进一步验证。它先跑一段,发现规律,再继续深入。这个过程有点像一个优秀分析师做研究:先形成假设,再找证据,证据不够就继续追问,发现矛盾就回到源头。如果让人手工做,复杂账单或经营分析可能要几天甚至一周。AI的优势不是“看一眼就知道答案”,而是能把大量探索、比对和验证过程自动化。
爱分析:分析深度是由记忆里面的计算决定的?占超群:可以说很大程度上由记忆计算决定,但更准确地讲,是由“模型规划能力 × 记忆计算能力 × 数据理解质量”共同决定。如果模型规划弱,它不知道该问什么;如果记忆计算弱,它无法在海量数据里执行有效分析;如果数据理解错了,所有分析都是建立在错误输入上。所以我们一直强调三位一体:专属数据理解模型、多模态数据平台、记忆管理和计算能力。企业AI的可靠性,不是某一个环节单独决定的,而是整条链路共同决定的。
爱分析:记忆的计算,模型是质变自己训练?训练的内容和方向是什么样的?占超群:我们会分层处理。外脑层面可以调用不同大模型,例如GPT、Claude、Gemini或国产大模型,这部分主要承担通用推理和任务规划。但在记忆内部,很多子任务并不需要超大模型,而需要高精度、低成本、可控的数据理解模型。我们训练和优化的重点包括:文档版式理解、表格结构还原、图文关联、多模态实体抽取、时间线构建、决策链抽取、长文档分块与压缩、跨文档对齐、冲突识别和证据溯源。换句话说,我们不是为了再训练一个通用聊天模型,而是训练一组面向记忆的专用模型。它们的目标不是“会聊天”,而是“把企业复杂数据理解对、组织好、算得准”。
爱分析:今年大家对token成本特别敏感,记忆层在降本上能帮企业什么?占超群:帮助非常直接。现在很多企业做AI的方式,是把大量上下文反复塞进模型。短期看简单,长期看token成本、延迟和稳定性都会出问题。记忆层的逻辑是反过来的:不是把几十GB原始数据喂给模型,而是让模型把计算意图投递到记忆里。记忆层通过检索、过滤、聚合、代码执行和证据压缩,返回最相关的结果。这样既减少重复上下文注入,也降低大模型对无关信息的处理负担。对企业来说,记忆层不只是让AI更懂我,也是把大模型调用从“粗放式堆token”变成“按需构建上下文 + 近数据计算”的降本工具。尤其在今年,很多客户确实会把token成本和硬件成本一起算总账。
04、记忆是渐进式执行,比ChatBI更灵活
爱分析:刚才的账单分析场景,记忆的分析能力和ChatBI能力很像?占超群:表面看有相似之处,都是让AI帮人分析数据,但底层逻辑不一样。ChatBI主要围绕结构化数据、指标体系和自然语言查询展开,适合回答“某个指标是多少、同比环比如何、按什么维度拆分”。记忆分析面对的是更开放的问题:为什么发生,过程证据在哪里,历史上类似情况怎么处理,哪些文档、邮件、审批和数据库记录能互相印证。所以,ChatBI更像一个自然语言数据分析入口,记忆更像一个跨文档、跨系统、跨时间的任务执行与证据推理层。
爱分析:那么记忆能cover掉整个ChatBI场景,还是说跟ChatBI定位不太一样?占超群:我不会简单说记忆会完全替代ChatBI,更准确的判断是:记忆会吸收一部分生成式分析需求,同时和成熟BI体系长期共存。对于指标查询、标准报表、固定经营看板,传统BI仍然有价值,因为它稳定、可控、响应快。但对于开放式问题,例如“为什么这个区域流量下降”、“某个项目为什么风险暴露”、“客户流失背后的真实原因是什么”等,单纯ChatBI就不够了。记忆的优势在于任务导向和渐进式执行。它可以先从问题出发,逐步查文档、跑数据、看工单、追审批、找历史案例,并在过程中不断调整分析路径,这比固化查询逻辑更接近真实业务分析。
爱分析:从记忆角度出发,企业的专属语义本身就已经在里边了?看上去对于ChatBI是完整的一个可以替代的过程,虽然路径不太一样。占超群:企业级数据领域有两个长期难题。第一,表太多、字段太多,人理解和使用的效率很低。第二,复杂业务问题往往不是一个SQL能回答的,而是需要跨数据、跨文档、跨流程去解释。过去很多数据中台和BI项目效果不理想,一个根本原因是没有真正从最终使用者视角出发。做数据源治理的人和真正做业务决策的人不是同一批人。一个字段名可能只有两个字,但业务人员心里关联的是一整套场景、风险、客户、策略和历史背景。记忆层可以在使用过程中不断补齐这些专属语义。比如AI在分析风险时发现某个字段描述不足,可以生成术语解释、补充业务属性,甚至提示数据团队更新口径。这样,企业语义不是一次性建模完成的,而是在AI与业务交互中持续演化。
爱分析:这些属性最终是映射到AI的记忆里,而不是在数据体系里?占超群:第一落点通常会在记忆里,因为很多业务语义是动态的、场景化的、因人而异的。先放在记忆里,AI才能在具体任务中灵活使用。但我不认为它永远不进入数据体系。比较成熟、稳定、被多人验证的语义,应该反哺数据治理,变成指标口径、字段描述、业务标签或主数据的一部分。记忆层和数据体系不是割裂的,而是一个前后端关系:记忆更靠近使用现场,数据治理更靠近长期规范。例如,有客户会用一个非常短的内部缩写来指代某类风险资产。对外部人来说,这个缩写几乎不可理解,但业务人员知道它背后对应资产类型、风险属性和一类处理规则。AI在使用过程中把这些语义记下来,下一次遇到类似表达就能正确理解。
爱分析:这样的话,记忆体有分支的概念,即使对于同一个数据,不同的描述都存下来了,用户不同的问法,就可以解决对应描述的问题了。占超群:对。企业里同一个数据对象,财务、销售、风控、运营、研发看到的含义可能完全不同。记忆层要允许多视角、多版本、多语义并存。这不是鼓励混乱,而是承认企业知识本来就是多视角的,关键在于系统要能区分:哪些是同一事实的不同表达,哪些是真正冲突的事实,哪些只在某个角色、项目或时间段内有效。用户不同问法背后往往代表不同任务意图,记忆层要把这些问法、意图和历史解释沉淀下来,让AI越用越懂企业语言。
爱分析:记忆还可以可视化出来让人去调?占超群:必须可以。企业不会信任一个完全黑盒、还会自我更新的记忆体。我们需要把记忆的多角度信息可视化出来:这条记忆来自哪里,关联哪些实体和事件,有哪些版本,和哪些记忆冲突,谁有权限看,何时被验证过,是否被用于某次决策。可视化不是锦上添花,而是企业级信任的基础。人可以查看、编辑、合并、废弃、回滚记忆,也可以调整权限和适用范围。只有这样,记忆系统才可能从“好像很聪明”走向“可以被组织托付”。
爱分析:企业侧落地,知识的权限和安全性是通过文档里边的字段和行去确认。那像记忆,是不是会面临比较大的权限和安全问题?占超群:是的,而且记忆的权限问题比普通文档更复杂。因为记忆不是简单复制原文,它会把跨文档、跨系统、跨人的信息重组起来。如果权限做不好,可能出现“单条数据不敏感,但组合后变敏感”的情况。我们一般从三层处理。第一是源数据权限。原始文档、项目、数据库、工单本身的权限要继承。第二是实体级权限。比如出资人、客户、项目、供应商、员工、合同等实体都有不同可见范围。某个角色可以看项目整体,但不一定能看出资人细节;可以看统计结果,但不一定能看原始明细。第三是动作权限。读取、写入、修改、删除、导出、调用外部工具,都应该有不同控制。所以,企业记忆的安全不是简单文档ACL,而是“源权限 + 实体权限 + 任务权限 + 审计”的组合。
爱分析:如果企业有一个OA,组织权限就可以继承到这里?占超群:可以继承,但不能机械继承。OA里的组织、角色、部门、项目组是基础身份体系,记忆层会把它映射到实体和任务权限上。比如某个管理人员在OA里属于项目组,但他能不能看供应商报价、员工绩效、客户敏感信息,还要结合业务规则判断。记忆层要支持企业已有权限体系,同时允许按实体、场景和任务做更细粒度控制。简单讲,OA提供身份与组织关系,记忆层提供面向AI使用场景的权限解释和执行。
爱分析:记忆既然是可写、还会自进化的,那会不会被污染、被投毒?企业凭什么信任一个会自己改自己的记忆体?占超群:这是记忆系统最关键的安全问题之一。传统prompt注入往往是单次、无状态的;记忆一旦被污染,风险会跨会话持续存在,这就是记忆系统特有的新攻击面。我们的思路不是假设AI永远不会被污染,而是把记忆写入和更新变成可治理过程。第一,写入要有策略。不同来源、不同角色、不同类型的信息,写入记忆的权限和置信度不同。第二,冲突要能被发现。新写入内容如果和高置信记忆矛盾,系统应提示冲突,而不是静默覆盖。第三,血缘要可追溯。每条记忆从哪来、谁写入、何时写入、是否被验证、是否被用于决策,都要可查。第四,版本要能回滚。污染发生后,企业不能只靠人工猜测,而要能定位影响范围并恢复到安全版本。第五,高风险写入要有人审。尤其是规则、价格、权限、合规口径、客户承诺这类记忆,不能完全交给自动化。企业信任记忆,不是因为它不会犯错,而是因为它的错误可发现、可解释、可纠正。
05、B端与C端共用一套记忆框架
爱分析:记忆虽然定位在infra层,但对于C端或B端用户来讲,是不是也有具体的应用场景,能让用户有更好的认知和理解?占超群:是的。infra的价值最终一定要通过场景让用户感知到。在B端,最直接的是办公助手、决策智能体、售后智能体、投资分析助手、经营分析助手、研发助手等。用户感受到的是:AI不再每次都从零开始,而是知道企业历史、知道业务语言、知道审批规则、知道过往案例。在C端,可以是跨应用个人助理、AI玩具、AI硬件、家庭机器人、陪伴式设备等。用户感受到的是:不同设备可以共享连续记忆,AI能理解长期关系、偏好、情绪和生活情境。所以,记忆作为infra在底层是统一的,但呈现给用户时一定是具体应用。
爱分析:会有那种穿戴式的记录生活的相机?它本质上是一个记忆。占超群:会有,但我要补一句:记录不等于记忆。穿戴式设备可以产生大量原始记录,比如图像、声音、位置、事件流。但真正的记忆要做选择、抽象、关联、遗忘和召回。人类记忆不是硬盘录像,AI记忆也不应该只是无差别录制。比如一个生活相机记录了你一天发生的事情,记忆层要判断哪些是重要事件,哪些只是噪声;哪些涉及隐私,哪些可以被未来任务调用;哪些需要和家庭、工作、健康或情绪状态关联。只有完成这些处理,它才从“记录系统”变成“记忆系统”。
爱分析:玩具的记忆是类似于个人的世界观,跟企业的记忆相比,是一套同样的体系,还是有明显区别?占超群:底层框架有共通之处,但记忆类型和约束差异很大。企业记忆强调行动、准确性、权限、合规、可解释和可回滚。它的目标是帮助 AI 做对事,尤其是高价值生产力任务。玩具和C端硬件记忆更强调连续关系、情绪、世界观、人设、跨端体验和响应速度。比如同一个孩子有10个玩具,他希望这些玩具共享一个连续记忆;玩具今天听到的故事,明天在游戏里还能延续。这里还涉及语义、情绪、关系、过程和多模态情境。如果进一步到机器人,还会有行动记忆、空间记忆、3D语义图谱、身体状态和环境交互记忆。它和企业记忆共享“长期状态管理”的底座,但上层类型差异很大。
爱分析:这么说,针对B端和C端,完全就两套不同的产品?占超群:不是完全两套产品,而是一套架构、不同记忆类型、不同治理策略。企业侧偏准确、权限、审计、私有化和业务闭环;C端偏低延迟、情绪连续性、跨设备、个性化和体验自然度。B端可以为了准确性慢一点,C端很多交互必须非常快,否则用户体验会断掉。所以底层是统一的:多模态理解、实体事件建模、记忆召回、版本、冲突、权限、生命周期。但配置、优化目标和产品形态会不同。
爱分析:这些是企业和个人都共通的点?
占超群:共通的是记忆框架:事实、事件、偏好、关系、行动、反思、世界观、情绪或情感状态,都可以作为不同类型的记忆被管理。不同的是权重。企业场景里,事实、证据、权限、流程和决策轨迹权重更高;个人和硬件场景里,关系、情绪、世界观、习惯和跨端连续性权重更高。我们会用Builder体系来适配不同数据源和应用形态。你可以把它理解为:底层是一套记忆操作系统,上层按场景装不同的“记忆应用”和“记忆类型”。
爱分析:记忆类型,现在是一个成熟的体系吗?或者说未来会有比较大的变化,导致底层的产品还需要大的迭代?
占超群:这个领域还没有完全成熟,我不想把话说满。现在行业对记忆类型的定义还在快速演化。我们已经看到很多类型:事实记忆、偏好记忆、事件流、决策轨迹、行动记忆、情绪记忆、反思记忆、世界观记忆、实体关系记忆、项目记忆、会话记忆等。不同智能体和不同场景对粒度要求也不同,有的按用户,有的按项目,有的按agent,有的按session,有的需要隔离共享,有的需要time travel和多版本冲突。我们从第一天设计架构时,就尽量避免把系统写死成某几类记忆。底层要支持扩展,因为未来一定会出现今天还没完全定义清楚的新记忆类型。
爱分析:怎么看待开源?通过开源去开拓市场,价值有多大?
占超群:我们会推进开源,但会比较克制地设计边界。记忆是一个需要生态共识的领域。开源对开发者教育、接口标准、连接器生态、评测基准和最佳实践都有价值。尤其在行业早期,大家需要看到可运行的参考架构,而不是只听概念。但企业级记忆真正难的部分,除了代码,还有数据理解能力、工程稳定性、部署能力、安全治理、权限体系、客户场景沉淀和持续运营。这些不是把代码放出来就自动解决的。所以,我们会把开源作为生态建设和标准推动的重要方式,但商业价值仍然来自企业级可靠性和场景深度。
爱分析:现在做记忆的厂商没那么多,是因为大家还没看到机会点?
占超群:一部分原因是市场认知还没有完全到位,另一部分原因是这件事确实比看起来难。现在很多人把记忆理解为“聊天记录摘要”或“RAG的一个模块”。如果只是这个层面,门槛似乎不高。但真正到企业生产力场景,问题会迅速复杂起来:文档理解、多模态表征、权限、冲突、版本、溯源、长期评测、成本、私有化部署,每一项都不是轻量功能。另外,很多公司是在具体任务里做一个特定记忆模块,还没有抽象成标准化基础设施。这个阶段有点像早期大数据:2007、2008年前后大家都在处理海量数据,只是当时还没有形成统一语言和成熟平台。
爱分析:离共识还比较远。
占超群:是的,但我认为方向上的共识会比大家想象得来得快。今天行业分歧主要在三个层面:第一,记忆到底是产品功能还是基础设施;第二,记忆和RAG、知识库、长上下文的边界在哪里;第三,企业级记忆的评测和治理标准怎么建立。随着更多真实场景落地,大家会逐渐意识到:记忆不是“模型背后的一个小功能”,而是智能体能不能进入生产力场景的关键前提。共识不是靠定义争出来的,而是靠场景跑出来的。
06、70%硬件投入,记忆所需的硬件比例比普通的AI应用要高得多
爱分析:从企业的infra角度出发,记忆会挤占掉原来很多知识和数据作为底座的价值?
占超群:我会说是价值重心会重新分配,而不是简单挤占。知识库、RAG、数据仓库、数据湖、数据中台都不会凭空消失。它们仍然是企业数据资产的重要组成部分。但在AI时代,企业需要一层面向智能体的记忆基础设施,把这些资产组织成AI可以长期使用、动态更新、可治理、可计算的状态。因此,RAG会从独立产品形态逐步变成记忆层里的检索原语;知识库会成为记忆层的来源之一;数据平台会继续作为底层事实源和治理底座存在。记忆层不是消灭它们,而是把它们重新编排到AI的任务闭环里。
爱分析:展开讲讲。
占超群:RAG的原始思想非常重要:把模型的参数化知识和外部非参数化知识结合起来,通过检索增强生成能力。但企业级应用走深以后,单纯RAG会暴露几个问题。第一,它通常是静态读多、动态写少。企业知识是不断变化的,人的经验、项目进展、客户承诺、审批口径都在变。如果系统不能写、不能改、不能追溯,就很难支撑长期任务。第二,RAG更多是“给问题找资料”,但企业决策需要“围绕任务组织证据”。这中间涉及多轮探索、假设验证、跨系统计算、冲突处理和结果复盘。第三,RAG往往以文档或片段为中心,而记忆要以实体、事件、关系和决策轨迹为中心。人使用知识不是一次搜索,而是一整套复杂过程。第四,企业知识天然多模态。文档、表格、图像、音频、视频、数据库、代码、聊天记录都可能是证据。只把文本切块存向量,远远不够。所以我认为,RAG不会消失,但会被记忆层内化。它是记忆系统中的检索能力,而不是企业AI的完整答案。
爱分析:RAG更像是一个一次性的,记忆是一个可进化的,是一个持续能解决问题、适应最新环境的?
占超群:可以这么理解,但我会稍微修正一下:RAG本身也可以做工程化更新,并不一定只能一次性。但它的核心仍然是检索增强,天然更偏“读”。记忆的核心是状态演化。它不仅要读,还要写;不仅要召回,还要判断是否过期;不仅要找相似内容,还要处理冲突、版本、生命周期和适用范围。RAG是以检索为核心的查询,记忆是由AI思考力驱动的状态管理和任务执行。这个差异会随着场景复杂度上升变得非常明显。
爱分析:企业用户确实对于AI自主规划的理解和认知还是有很大的一个问号,反正工作流是最直接的,即使到现在,大部分企业也不会觉得自主规划的工作流能占主流。
占超群:这个担心是合理的。企业不会因为一个AI看起来会规划,就把核心流程全部交出去。我认为自主规划进入企业,会经历几个阶段。第一阶段是辅助式,AI帮人找资料、做分析、给建议。第二阶段是受控执行,AI在明确权限和边界内完成部分任务。第三阶段才是更高比例的闭环智能体,但也一定有审计、回滚和人工干预机制。记忆在这里的作用,是给自主规划装上“轨道”。它告诉AI过去类似任务怎么做,哪些规则不能碰,哪些数据可信,哪些动作需要审批,哪里容易出错。没有记忆的自主规划很容易飘;有了决策轨迹和组织约束,AI才可能在企业里逐步承担更复杂任务。所以,未来不是工作流突然消失,而是工作流从硬编码流程,逐步演化为“规则流程 + 记忆约束 + 智能规划”的混合形态。
爱分析:从商业化落地角度,记忆是按应用还是按infra,拿客户的哪一部分预算?占超群:两种都有,取决于客户成熟度和采购方式。对于某些大型办公软件或平台型客户,更容易以infra方式接入,通过API、SDK或平台能力嵌入到自己的产品和智能体体系里。对于央国企、运营商和大型集团,往往是“基座 + 应用”一起采购。客户既需要底层记忆平台,也需要上层决策智能体、分析助手或业务应用,否则单独买infra很难快速产生业务价值。预算来源也会混合:AI基础设施预算、数据平台预算、知识管理预算、业务应用预算,甚至部分会进入数字化转型或经营分析专项。企业真正关心的不是这个预算叫什么,而是它能不能沉淀长期资产、提升任务成功率、降低试错成本。
爱分析:介绍下实际的落地案例。占超群:可以讲两个典型方向。第一类是某大型央企的项目分析和季度经营分析。每个季度要汇总大量材料,包括邮件、Excel、PDF、Word、项目报告、行业资料等。客户希望按公司、项目、行业、风险维度串起来,做风险评估、运营管理、行业判断和后续行动建议。这个场景用普通RAG很难做好,因为它不是单文档问答,而是跨材料、跨时间、跨组织的综合决策。第二类是某大型运营商场景。运营商有大量策略文档、经营数据、数仓数据和业务系统数据。以前经分更多是回答“发生了什么”,比如KPI为什么没完成、哪个区域下降了。现在客户更关心“下一步该怎么做”,比如套餐策略怎么调、渠道动作怎么排、用户流失怎么干预。这就从分析走向决策,需要记忆把历史策略、执行过程和结果反馈串起来。这两个场景的共同点是:数据量大、来源复杂、准确性要求高、决策链长。它们正是企业级记忆最能体现价值的地方。
爱分析:像这类央国企项目,如果把Infra和应用包在一起,整体的预算大概在什么级别?软件和硬件的比例是多少?
占超群:从我们目前服务的重型客户看,一个完整项目如果包含infra和上层应用,软件侧可能在几百万元级,典型重型部署大概在300万元左右;如果算上硬件,总体可能接近千万元级。当然,这不是标准报价,不同客户的数据规模、部署环境和场景复杂度差异很大。硬件占比可能到70%左右,比普通AI应用更高。原因是记忆infra要做大规模数据编排和多模态模型加工。很多大客户一个文档就几千页,历史材料数量非常大。要把它们分布式并行解析、理解、索引和计算,GPU、存储和网络资源都要上去。但客户算的不是一次性软硬件账,而是长期能力账。更重要的是,在合规授权和组织治理前提下,把长期项目中被验证的判断依据、处理路径和复盘结果,转化为可复用的组织最佳实践。它的价值体现为降低重复试错、缩短新人熟悉业务的周期、提升跨团队协同一致性,并让关键经验随业务演化持续累积。
爱分析:2026年,质变科技有什么规划和目标?
占超群:2026年我们会沿着三个方向推进。第一,继续扩展多模态记忆能力,特别是面向C端情感情绪、AI潮玩、AI硬件和具身智能的记忆类型。机器人和硬件场景会引入更多空间、行动、情绪和长期关系记忆。第二,深化数据理解和多模态理解模型能力。企业级记忆的地基是理解准确率,文档、表格、图像、视频、代码、工单等理解得越准,后面的记忆计算和智能体执行才越可靠。第三,继续打通主流大模型和智能体生态。我们会支持更多国外和国内模型、agent框架、办公系统、IM系统和企业数据源,让记忆成为跨模型、跨应用的基础设施。总体目标很明确:让记忆从一个新概念,变成企业AI落地中真正可复用、可验证、可治理的底座。
爱分析:记忆领域,国外有哪些不错的厂商?
占超群:国外有一些值得关注的方向,但不同公司切入点不同。从data infra角度看,Databricks这类公司有机会,因为它们在数据平台、治理、企业客户和生态上有积累。如果把AI记忆理解成数据智能平台向智能体时代的延伸,它们具备一定基础。另外,Mem0、Zep、Letta这些公司和项目在开发者记忆、agent memory、时序知识图谱、MemGPT工程化等方向上都做了探索,值得尊重。但我会说,它们和我们关注的企业生产力场景还不完全是同一层级的问题。我们要啃的是更重的场景:数据规模更大、准确性要求更高、权限和合规更复杂、部署环境更严格,真正同时具备data infra、多模态模型、记忆管理和记忆计算能力的公司,全球范围内都不会太多。我不想把话说得太绝对,因为这个领域还在早期。但我们判断,未来能跑出来的记忆公司,一定不是只做一个聊天摘要功能,而是能成为AI时代数据基础设施的一部分。
349