RAG必将被吃掉

这是一次关于AI记忆的深度对话。随着大模型落地进入深水区，记忆成为企业AI不可绕开的议题。不过，市场对记忆的认知仍然较为浅显——有人将其视为基模的一部分，有人将其等同于RAG工程化的一环，记忆在企业AI基础设施中的位置与价值尚未形成共识。为厘清这一概念和本质，追踪最新的行业实践和落地进展，爱分析与质变科技创始人占超群进行了深度交流。质变科技定位为独立于基模的记忆基础设施提供商，核心产品覆盖企业级决策轨迹、记忆计算、多模态理解等能力，目前服务金山办公、国投，以及运营商、玩具公司等不同类型客户。在此次访谈中，占超群分享了他对记忆本质、记忆与基模的关系、决策轨迹，以及记忆与知识库/RAG的本质区别、B端与C端的差异、商业化落地等核心话题的系统思考。
核心观点记忆是智能体进化的基础设施。

大模型提供的是通用思考力，记忆提供的是可持续积累的经验、事实、偏好、决策轨迹与环境状态。一个真正有用的AI，需要思考力与记忆力协同。没有记忆，AI很容易停留在一次性问答。决策轨迹型记忆是企业AI的关键突破口。

企业真正稀缺的往往不是文档本身，而是“为什么这么做”的过程性经验。记忆层要在授权、权限和治理边界内，把组织运行中被验证过的审批依据、处理路径、异常判断与复盘反思，沉淀为可参考、可复用、可演化的最佳实践，让经验随业务持续迭代，而不是依赖零散口耳相传。RAG会被记忆层内化为一个检索原语。

RAG作为检索增强生成的范式非常重要，但它更多解决“从外部资料找相关内容”的问题。企业级记忆要解决的是长期状态、动态写入、多源冲突、版本溯源、决策轨迹、权限安全和近数据计算。因此，未来RAG不会消失，但会成为记忆层中的一个能力，而不是完整答案。企业记忆需要中立、可携带、跨模型。

模型可以迭代、切换、组合使用，但企业和个人的记忆不应被锁死在某一个模型生态里。我们认为未来会出现类似“记忆护照”的形态：One Memory, One Truth。记忆跟人、组织和业务过程走，而不是跟某一代模型走。做好记忆基础设施，需要三位一体的能力。

第一是专属的数据理解模型，尤其是文档、表格、图片、音频、视频等多模态理解；第二是多模态数据平台与存储表征能力；第三是记忆管理与记忆计算能力，包括压缩、召回、版本、冲突、血缘、权限、代码执行与任务级上下文构建。

以下为本次访谈实录，在不改变原意基础上略有修改。

01、记忆独立于模型，是AI进化的基础

爱分析：对于记忆，业内认知还比较浅，理解也不太一样。从infra这层来讲，记忆和基模之间是什么关系？各自边界在哪里？占超群：我倾向于把它们理解成AI系统里的两类基础能力：基模主要提供“思考力”，记忆主要提供“进化所依赖的状态”。思考力解决的是模型能不能推理、规划、泛化和调用工具；记忆解决的是系统能不能长期记住事实、经验、偏好、决策过程以及环境变化。从计算机系统的类比看，模型参数更像一种长期压缩过的通用知识，当前上下文更像工作内存，而企业记忆更接近一套面向AI的持久化状态层。它不是把数据简单存起来，而是要能被AI理解、调用、更新、校验和治理。所以边界大致是：基模负责通用智能与推理，记忆层负责企业专属状态与经验积累。二者不是替代关系，而是乘法关系。模型再强，如果没有持续积累的企业上下文，就容易停留在“瞬时聪明”；记忆再丰富，如果没有足够强的模型去理解和推理，也只是静态资料库。

爱分析：如果要实现自进化，思考力和记忆力分别要做到什么程度？它们之间是怎么互相提升的？占超群：自进化不是一个口号，它至少要求两件事同时成立。第一，思考力要足够强。它要支持长程推理、复杂任务分解、工具调用、低幻觉输出，以及对不确定性的判断。尤其在企业生产力场景里，AI不只是回答问题，还要能解释为什么这么做、下一步怎么做、风险在哪里。第二，记忆力要足够可靠。它不仅要能保存已有知识，还要能理解外部数据、沉淀过程经验、识别冲突、形成版本，并在合适的时机召回。记忆不是存得越多越好，而是要在任务发生时构造出足够精炼、足够完整、足够可信的上下文。两者的关系是互相增强的。模型通过推理把工作过程中的经验抽象为记忆；记忆又反过来为模型下一次推理提供事实依据、历史案例和组织偏好。智能体之所以能越来越聪明，本质上依赖这个闭环，而不是单次问答能力的线性叠加。

爱分析：对于企业用户来讲，是否存在两个记忆体——大模型内部有，企业自己内部也有一个统一的记忆？占超群：可以这么理解，但我会更谨慎地表述为：模型内部确实会有某种产品级或用户级的记忆能力，但企业真正需要的是一份可治理、可携带、可审计的统一记忆。在企业侧，我们通常从两个视角建设记忆。第一是岗位或角色视角，也可以理解为“工作脑”。这里关注的是岗位场景中的可复用方法，而非个人表现本身。审批依据、异常处理路径、客户响应边界、代码评审关注点等，背后都有组织在真实业务中反复验证过的处理逻辑。员工经验本身应当被尊重；记忆层做的是在授权和治理前提下，沉淀其中可共享、可复用、可审计的部分，形成组织最佳实践，让新人少走弯路，也让团队在同一事实和方法框架下协作。第二是企业整体视角。以售后场景为例，一个产品从定义、研发、测试、文档、培训、交付到客户反馈，中间每个环节都会产生信息损耗。客户最后提出一个问题时，如果AI只看售后文档，往往离真实原因很远。企业级记忆要把代码、产品定义、测试记录、培训材料、安装记录、工单反馈等串起来，形成公司级连续记忆，让AI能沿着链路追溯问题根因。

爱分析：听起来，记忆是要把数据拉通之后，进一步去挖掘里面的隐性知识。它跟过去我们提的数据中台有什么本质区别？是不是在传统数据治理之上多了一层？占超群：我不认为它只是“多了一层”。传统数据中台主要解决的是数据资产的集中、治理和服务化问题，但它面对的是一个相对静态的世界：字段、表、指标、标签、权限、报表。它很重要，但它并不天然等于AI记忆。AI记忆有两个本质差异。第一，它是以问题和使用者为中心实时组织上下文，而不是以数据资产本身为中心。过去做数据中台的人和业务使用者往往不是同一批人，中间存在天然语义断层。今天有了大模型，系统可以围绕一个具体问题去理解、查找、重组和验证信息，形成任务级上下文。第二，它把大量过去无法有效治理的非结构化经验纳入进来。企业真正高价值的信息大量存在于文档、邮件、会议、聊天、代码、图片、视频、工单和人的操作轨迹里。没有大模型之前，这些信息很难被结构化、关联和复用；今天这件事开始可行。所以，数据中台更多解决“数据能不能被管”；记忆层解决“经验能不能被AI理解、复用、演化”。这是两代基础设施的差异。

爱分析：现在上下文窗口越来越大，Gemini都做到200万token了，很多人会问：全塞进上下文不就行了，为什么还要一个独立的记忆层？占超群：这是当前很常见的误解。长上下文非常重要，它解决的是“这一次能看多少”。但记忆层解决的是“长期能不能记住、能不能更新、能不能治理、能不能复用”。这两件事不能混为一谈。我经常用一个朴素类比：上下文窗口是内存，记忆是硬盘，不能因为内存条变大了，就把硬盘扔了。企业更不会因为某一代模型支持更长上下文，就放弃自己的数据资产和决策资产。原因至少有三个。第一，上下文是一次性工作内存，记忆是跨会话、跨任务、跨模型的持久状态。会话结束以后，上下文不应成为企业长期经验的唯一载体。第二，上下文按token消耗，企业不可能每次都把几十GB甚至TB级数据重新塞给模型。更合理的方式是由记忆层按任务需要构建精炼上下文，并在数据附近完成一部分计算。第三，长上下文不等于高质量召回。窗口越长，噪声也越多，关键事实可能被淹没。真正可靠的系统需要检索、排序、压缩、溯源、冲突识别和权限控制，而不是简单“全塞进去”。

02、AI眼里的好记忆是决策轨迹

爱分析：员工的工作脑记忆里边，一个是任务执行，类似于SOP记忆，这种记忆有规范、标准，好和不好是有概念的；但另外一种，纯粹经验层面的，如处理事情的方法和思路，那么AI怎么去判断它是一个好的知识？AI能自己识别吗？占超群：这里要先把“好知识”这个概念拆开。企业里很多经验不是简单的对错题，而是条件题。某个审批为什么通过，某个客户为什么特殊处理，某个财务异常为什么没有按标准流程走，背后往往取决于上下文、约束条件、历史惯例和风险偏好。我们现在重点做的方向叫决策轨迹。它不是简单记录“做了什么”，更不是把个人经验机械复制成模板，而是记录“为什么这么做”：当时看到哪些证据，遵循了哪些规则，权衡了哪些风险，最终由谁做了判断。它本质上是把人和组织在真实业务中被验证过的过程性经验，结构化为可参考、可复用、可演化的记忆。AI能做初步识别，比如从过往工单、邮件、审批和会议记录里抽取决策链，找出相似案例，判断某个处理是否符合历史模式。但在高价值或高风险场景里，AI不应独自定义什么是“好”。更合理的做法是：AI负责发现、归纳、对比和提示，人负责确认边界、合规性和例外条件。以财务场景为例，绝大多数规则性动作可以逐步自动化，但最关键的一小部分往往是需要经验判断的异常场景。记忆层要支持的恰恰是这部分：当规则不够用时，为人提供可追溯的历史案例、约束条件和参考路径，辅助人做出更稳健的最终判断。

爱分析：这个收敛的过程是因人而异的、一人一个工作脑，还是说当决策轨迹足够多以后，由AI自己去总结出一套通用的最佳实践？占超群：两者都会发生，但顺序很重要。我们通常先从一条条具体行为开始，把它还原成决策链记忆：输入是什么，判断过程是什么，行动是什么，结果是什么，后续有没有复盘。当决策链积累到一定规模以后，系统可以做聚类、归纳和对比，形成“在某类条件下通常怎么处理”的经验模型。但我不会轻易说它就是绝对最佳实践。企业场景里更准确的说法是“在特定约束下被验证过的高置信实践”。当新人或接手同类任务的成员处理一个审批或工单时，系统会先找相似决策轨迹，展示过去怎么做、为什么这么做、结果如何。人可以参考既有路径，也可以基于新情况提出新的判断。新的判断如果在后续被验证有效，就会进入候选记忆并形成新的高置信实践。这样，系统不是一次性训练出一个固定SOP，而是在持续工作中帮助组织实践不断演化。

爱分析：那这些决策链里的审批节点，是需要人工去预设好，还是说AI在读取数据后，自己去不断挖掘和提炼出新的节点？占超群：实际上是人机结合。企业里有一部分节点本来就是显性的，比如OA流程、审批流、工单状态、财务规则、代码评审节点，这些可以直接继承。还有一部分节点是隐性的，比如“这个客户为什么被特殊处理”“这个异常为什么暂缓”“这个风险为什么被放大”，这些需要AI从上下文里挖掘。AI的价值在于发现那些没有被流程系统明确定义、但真实影响决策的中间变量。比如一封邮件里的语气、一次会议里的承诺、历史工单中的反复故障、某个客户的特殊SLA，这些都可能成为决策节点。但节点被挖掘出来以后，需要有治理机制。它可以先作为低置信度候选记忆，经过业务人员确认、后续结果验证，再进入高置信度记忆。企业AI不能只追求自动化，还必须追求可解释和可控。

爱分析：日常工作中，还会不断有新的决策轨迹堆叠，哪些要堆上去，哪些没那么合理，需要持续有人去判断？占超群：是的，这就是记忆堆叠和记忆治理。记忆和知识库一个很大的区别在于：知识库通常是静态写、静态读；记忆是动态写、动态读，而且需要不断修正。在实践中，我们会给记忆设置多维度的置信机制：来源是否可靠、是否被多人确认、是否有结果反馈、是否与现有规则冲突、是否近期仍有效、是否属于例外情况。不是所有新行为都应该立刻成为组织记忆，也不是所有历史经验都应该永远有效。人仍然在闭环里。对于高风险场景，新的决策轨迹可以先进入候选区，由负责人确认；对于低风险场景，系统可以先形成低置信候选记忆，再通过结果反馈、多人确认或后续复盘逐步提升置信度。记忆系统可信的前提，不是它永远不犯错，而是每条记忆都能被查、被改、被撤回。

爱分析：也就是说，记忆有很多分支版本？占超群：对。企业记忆有点像Git，不是一个永远只有单一版本的文本库，而是一个可以多人协作、多分支演化、可合并、可回滚的状态系统。以报价为例，定价表里写过一个价格，销售会议讨论过另一个价格，老板在聊天里又给过一个特殊授权。AI不能简单取一个平均值，也不能随便相信最新一句话。它需要知道每个事实来自哪里，谁说的，何时说的，适用于哪个客户，是否被确认过，是否已经过期。这就是版本、血缘和冲突管理的意义。最终业务负责人可以明确说：这个客户以我在某次正式沟通中确认的版本为准。系统就会把这次确认作为新的高置信记忆，同时保留旧版本和适用范围。没有这套机制，记忆就会变成更危险的“自信错误”。

爱分析：记忆跟知识库有哪些区别？占超群：我会从五个维度区分。第一，知识库以文档和条目为中心，记忆以任务、实体、事件和决策轨迹为中心。第二，知识库通常是只读或弱写入，记忆必须支持读写、更新、冲突处理和版本演化。第三，知识库主要解决检索问题，记忆还要解决“什么时候该记、该忘、该合并、该覆盖、该提醒”的生命周期问题。第四，知识库较少处理跨系统过程经验，而记忆要把邮件、会议、代码、工单、报表、审批、数据库等多源信息组织成连续上下文。第五，企业记忆必须内置权限、安全、溯源和近存储计算。它不仅要回答“答案是什么”，还要回答“依据是什么、谁能看、是否过期、能不能回滚”。所以，知识库是记忆层里的重要组成，但不等于记忆层。

爱分析：日常需要跟记忆去交互的，涉及所有的企业内部相关系统？占超群：从最终形态看，是的。因为企业AI要解决真实问题，就不可避免地要连接真实系统：OA、IM、邮件、CRM、ERP、代码仓库、数据仓库、工单系统、知识库、文档系统、会议系统等。但这不是简单“全部打通”。企业记忆需要一套统一的连接、索引、权限和审计机制。每接一个系统，都要回答几个问题：哪些数据可以进入记忆，谁有权看，哪些信息只能作为计算依据不能暴露，哪些记忆可以写回，哪些动作需要审批。未来的数据技术会出现一个面向AI的记忆infra。它不只是服务搜索，而是服务智能体的长期任务执行。否则AI很难真正进入生产力核心环节。

03、为什么记忆难做？需要专属模型、多模态能力、记忆管理和计算能力

爱分析：记忆作为基础设施一部分，消耗的算力应该比应用还要多？占超群：在重型企业场景里，经常会是这样，但也要看任务类型。记忆的算力不是只发生在问答时，而是发生在全生命周期：数据接入、文档解析、多模态理解、结构化抽取、索引构建、摘要压缩、版本比对、冲突检测、权限计算，以及任务执行时的近存储计算。尤其是我们做的很多客户，文档不是几十页，而是几千页、几十万页；数据也不是单一文本，而是PDF、Word、Excel、图片、音频、视频、代码和数据库混在一起。如果前面的理解错了，后面的记忆和推理都会错，这就是Garbage in, Garbage out。所以，在高准确率生产力场景里，记忆infra的计算投入往往不低于应用层，甚至更高。

爱分析：这样的话，以记忆为中心的基础设施，和以思考力或者说以模型计算为核心的基础设施，是完全独立的两套体系？占超群：我不认为它们是完全独立的两套体系，更准确地说，是两类相对独立、但高度耦合的基础设施。模型计算负责推理、规划、生成和工具调用；记忆计算负责数据理解、状态管理、召回、压缩、溯源、冲突、权限和近数据执行。两边都需要模型，也都需要算力，但关注点不同。如果思考力弱，AI做复杂任务的规划和推理能力会不足；如果记忆力弱，AI的任务成功率、上下文一致性和可信度会不足。企业最终买的不是单点能力，而是“能不能稳定完成任务”。从这个角度看，思考力和记忆力缺一不可。

爱分析：模型厂商为什么不能同时做模型和记忆？为什么只会侧重于思考力？占超群：模型厂商当然可以做记忆，而且已经在做。但企业级独立记忆层仍然有存在价值，原因主要有三点。第一是中立性。企业不会希望自己的长期记忆被绑定在某一个模型里。今天用GPT，明天用Claude，后天用Gemini或国产模型，这很正常。模型可以换，但企业记忆最好只有一份。记忆跟人和组织走，而不是跟模型供应商走。第二是治理边界。模型厂商的产品型记忆更多面向用户体验和个性化，企业记忆面对的是权限、安全、审计、合规、血缘、版本、冲突、私有化部署和信创适配。这些不是“记住用户偏好”能覆盖的。第三是技术栈差异。做好企业记忆，需要很强的数据理解模型、多模态数据平台、记忆管理和记忆计算能力。给你一个几千页PDF、几十个 Excel、若干会议纪要和多套数据库，系统要理解版式、表格、图像、实体、时间线、业务语义和决策链。这件事不是在聊天产品里加一个memory功能就能解决的。

爱分析：但现在模型厂自己都在做记忆了，OpenAI上个月刚发了Dreaming V3，谷歌有Personal Context，Claude也全量开了记忆。它们自带的记忆，和你们这种独立记忆层到底差在哪？占超群：我认为这恰恰证明了记忆正在成为AI的核心能力。无论厂商具体叫什么版本，方向都很清楚：AI不能只靠一次性上下文，必须具备长期个性化和持续状态。但模型厂商自带记忆和企业独立记忆层的边界还是明显的。第一，所有权和可携带性不同。产品型记忆通常跟随某个模型或某个应用生态，企业级记忆需要跨模型、跨应用、跨系统。用户真正希望的是“一份记忆，多处可用”。第二，准确性和治理要求不同。消费级记忆记错一句偏好，通常只是体验问题；企业记忆记错一个报价、权限、审批依据或客户承诺，可能就是经营事故。第三，能力深度不同。企业级记忆要处理多源数据、实体级权限、冲突管理、血缘溯源、版本回滚、私有化部署、信创环境和近存储计算。模型黑盒里的记忆通常很难让企业审计每一条记忆从哪来、为什么生效、如何撤销。所以，我们不是否定模型厂商做记忆，而是认为：模型厂商做的是产品体验层的记忆，企业还需要一层中立、可治理、可携带的记忆基础设施。

爱分析：记忆是一套独立的计算能力？占超群：是的。记忆不只是被检索的对象，它本身也要具备计算能力。举个账单分析的例子。AI首先会search memory，找到与账单相关的合同、邮件、发票、审批、历史付款记录和异常说明。接下来它不会把所有原始材料都塞进大模型，而是在记忆层里做筛选、聚合、计算、比对和溯源，只把关键证据和结果交给模型继续推理。这就是近存储计算。随着企业数据规模越来越大，未来很多计算逻辑会从模型侧下沉到记忆侧。大模型负责提出问题和规划路径，记忆引擎负责在数据附近执行计算、返回可信证据。

爱分析：这里边的步骤是AI自主规划的？占超群：是由模型的思考力来规划，但不是不受约束的自由发挥。一个可靠的企业智能体，应该在记忆系统提供的工具、权限、数据目录和安全策略内做规划。它会不断问记忆：有哪些相关数据，哪些证据可信，哪些信息冲突，哪些结果需要进一步验证。它先跑一段，发现规律，再继续深入。这个过程有点像一个优秀分析师做研究：先形成假设，再找证据，证据不够就继续追问，发现矛盾就回到源头。如果让人手工做，复杂账单或经营分析可能要几天甚至一周。AI的优势不是“看一眼就知道答案”，而是能把大量探索、比对和验证过程自动化。

爱分析：分析深度是由记忆里面的计算决定的？占超群：可以说很大程度上由记忆计算决定，但更准确地讲，是由“模型规划能力 × 记忆计算能力 × 数据理解质量”共同决定。如果模型规划弱，它不知道该问什么；如果记忆计算弱，它无法在海量数据里执行有效分析；如果数据理解错了，所有分析都是建立在错误输入上。所以我们一直强调三位一体：专属数据理解模型、多模态数据平台、记忆管理和计算能力。企业AI的可靠性，不是某一个环节单独决定的，而是整条链路共同决定的。

爱分析：记忆的计算，模型是质变自己训练？训练的内容和方向是什么样的？占超群：我们会分层处理。外脑层面可以调用不同大模型，例如GPT、Claude、Gemini或国产大模型，这部分主要承担通用推理和任务规划。但在记忆内部，很多子任务并不需要超大模型，而需要高精度、低成本、可控的数据理解模型。我们训练和优化的重点包括：文档版式理解、表格结构还原、图文关联、多模态实体抽取、时间线构建、决策链抽取、长文档分块与压缩、跨文档对齐、冲突识别和证据溯源。换句话说，我们不是为了再训练一个通用聊天模型，而是训练一组面向记忆的专用模型。它们的目标不是“会聊天”，而是“把企业复杂数据理解对、组织好、算得准”。

爱分析：今年大家对token成本特别敏感，记忆层在降本上能帮企业什么？占超群：帮助非常直接。现在很多企业做AI的方式，是把大量上下文反复塞进模型。短期看简单，长期看token成本、延迟和稳定性都会出问题。记忆层的逻辑是反过来的：不是把几十GB原始数据喂给模型，而是让模型把计算意图投递到记忆里。记忆层通过检索、过滤、聚合、代码执行和证据压缩，返回最相关的结果。这样既减少重复上下文注入，也降低大模型对无关信息的处理负担。对企业来说，记忆层不只是让AI更懂我，也是把大模型调用从“粗放式堆token”变成“按需构建上下文 + 近数据计算”的降本工具。尤其在今年，很多客户确实会把token成本和硬件成本一起算总账。

04、记忆是渐进式执行，比ChatBI更灵活

爱分析：刚才的账单分析场景，记忆的分析能力和ChatBI能力很像？占超群：表面看有相似之处，都是让AI帮人分析数据，但底层逻辑不一样。ChatBI主要围绕结构化数据、指标体系和自然语言查询展开，适合回答“某个指标是多少、同比环比如何、按什么维度拆分”。记忆分析面对的是更开放的问题：为什么发生，过程证据在哪里，历史上类似情况怎么处理，哪些文档、邮件、审批和数据库记录能互相印证。所以，ChatBI更像一个自然语言数据分析入口，记忆更像一个跨文档、跨系统、跨时间的任务执行与证据推理层。

爱分析：那么记忆能cover掉整个ChatBI场景，还是说跟ChatBI定位不太一样？占超群：我不会简单说记忆会完全替代ChatBI，更准确的判断是：记忆会吸收一部分生成式分析需求，同时和成熟BI体系长期共存。对于指标查询、标准报表、固定经营看板，传统BI仍然有价值，因为它稳定、可控、响应快。但对于开放式问题，例如“为什么这个区域流量下降”、“某个项目为什么风险暴露”、“客户流失背后的真实原因是什么”等，单纯ChatBI就不够了。记忆的优势在于任务导向和渐进式执行。它可以先从问题出发，逐步查文档、跑数据、看工单、追审批、找历史案例，并在过程中不断调整分析路径，这比固化查询逻辑更接近真实业务分析。

爱分析：从记忆角度出发，企业的专属语义本身就已经在里边了？看上去对于ChatBI是完整的一个可以替代的过程，虽然路径不太一样。占超群：企业级数据领域有两个长期难题。第一，表太多、字段太多，人理解和使用的效率很低。第二，复杂业务问题往往不是一个SQL能回答的，而是需要跨数据、跨文档、跨流程去解释。过去很多数据中台和BI项目效果不理想，一个根本原因是没有真正从最终使用者视角出发。做数据源治理的人和真正做业务决策的人不是同一批人。一个字段名可能只有两个字，但业务人员心里关联的是一整套场景、风险、客户、策略和历史背景。记忆层可以在使用过程中不断补齐这些专属语义。比如AI在分析风险时发现某个字段描述不足，可以生成术语解释、补充业务属性，甚至提示数据团队更新口径。这样，企业语义不是一次性建模完成的，而是在AI与业务交互中持续演化。

爱分析：这些属性最终是映射到AI的记忆里，而不是在数据体系里？占超群：第一落点通常会在记忆里，因为很多业务语义是动态的、场景化的、因人而异的。先放在记忆里，AI才能在具体任务中灵活使用。但我不认为它永远不进入数据体系。比较成熟、稳定、被多人验证的语义，应该反哺数据治理，变成指标口径、字段描述、业务标签或主数据的一部分。记忆层和数据体系不是割裂的，而是一个前后端关系：记忆更靠近使用现场，数据治理更靠近长期规范。例如，有客户会用一个非常短的内部缩写来指代某类风险资产。对外部人来说，这个缩写几乎不可理解，但业务人员知道它背后对应资产类型、风险属性和一类处理规则。AI在使用过程中把这些语义记下来，下一次遇到类似表达就能正确理解。

爱分析：这样的话，记忆体有分支的概念，即使对于同一个数据，不同的描述都存下来了，用户不同的问法，就可以解决对应描述的问题了。占超群：对。企业里同一个数据对象，财务、销售、风控、运营、研发看到的含义可能完全不同。记忆层要允许多视角、多版本、多语义并存。这不是鼓励混乱，而是承认企业知识本来就是多视角的，关键在于系统要能区分：哪些是同一事实的不同表达，哪些是真正冲突的事实，哪些只在某个角色、项目或时间段内有效。用户不同问法背后往往代表不同任务意图，记忆层要把这些问法、意图和历史解释沉淀下来，让AI越用越懂企业语言。

爱分析：记忆还可以可视化出来让人去调？占超群：必须可以。企业不会信任一个完全黑盒、还会自我更新的记忆体。我们需要把记忆的多角度信息可视化出来：这条记忆来自哪里，关联哪些实体和事件，有哪些版本，和哪些记忆冲突，谁有权限看，何时被验证过，是否被用于某次决策。可视化不是锦上添花，而是企业级信任的基础。人可以查看、编辑、合并、废弃、回滚记忆，也可以调整权限和适用范围。只有这样，记忆系统才可能从“好像很聪明”走向“可以被组织托付”。

爱分析：企业侧落地，知识的权限和安全性是通过文档里边的字段和行去确认。那像记忆，是不是会面临比较大的权限和安全问题？占超群：是的，而且记忆的权限问题比普通文档更复杂。因为记忆不是简单复制原文，它会把跨文档、跨系统、跨人的信息重组起来。如果权限做不好，可能出现“单条数据不敏感，但组合后变敏感”的情况。我们一般从三层处理。第一是源数据权限。原始文档、项目、数据库、工单本身的权限要继承。第二是实体级权限。比如出资人、客户、项目、供应商、员工、合同等实体都有不同可见范围。某个角色可以看项目整体，但不一定能看出资人细节；可以看统计结果，但不一定能看原始明细。第三是动作权限。读取、写入、修改、删除、导出、调用外部工具，都应该有不同控制。所以，企业记忆的安全不是简单文档ACL，而是“源权限 + 实体权限 + 任务权限 + 审计”的组合。

爱分析：如果企业有一个OA，组织权限就可以继承到这里？占超群：可以继承，但不能机械继承。OA里的组织、角色、部门、项目组是基础身份体系，记忆层会把它映射到实体和任务权限上。比如某个管理人员在OA里属于项目组，但他能不能看供应商报价、员工绩效、客户敏感信息，还要结合业务规则判断。记忆层要支持企业已有权限体系，同时允许按实体、场景和任务做更细粒度控制。简单讲，OA提供身份与组织关系，记忆层提供面向AI使用场景的权限解释和执行。

爱分析：记忆既然是可写、还会自进化的，那会不会被污染、被投毒？企业凭什么信任一个会自己改自己的记忆体？占超群：这是记忆系统最关键的安全问题之一。传统prompt注入往往是单次、无状态的；记忆一旦被污染，风险会跨会话持续存在，这就是记忆系统特有的新攻击面。我们的思路不是假设AI永远不会被污染，而是把记忆写入和更新变成可治理过程。第一，写入要有策略。不同来源、不同角色、不同类型的信息，写入记忆的权限和置信度不同。第二，冲突要能被发现。新写入内容如果和高置信记忆矛盾，系统应提示冲突，而不是静默覆盖。第三，血缘要可追溯。每条记忆从哪来、谁写入、何时写入、是否被验证、是否被用于决策，都要可查。第四，版本要能回滚。污染发生后，企业不能只靠人工猜测，而要能定位影响范围并恢复到安全版本。第五，高风险写入要有人审。尤其是规则、价格、权限、合规口径、客户承诺这类记忆，不能完全交给自动化。企业信任记忆，不是因为它不会犯错，而是因为它的错误可发现、可解释、可纠正。

05、B端与C端共用一套记忆框架

爱分析：记忆虽然定位在infra层，但对于C端或B端用户来讲，是不是也有具体的应用场景，能让用户有更好的认知和理解？占超群：是的。infra的价值最终一定要通过场景让用户感知到。在B端，最直接的是办公助手、决策智能体、售后智能体、投资分析助手、经营分析助手、研发助手等。用户感受到的是：AI不再每次都从零开始，而是知道企业历史、知道业务语言、知道审批规则、知道过往案例。在C端，可以是跨应用个人助理、AI玩具、AI硬件、家庭机器人、陪伴式设备等。用户感受到的是：不同设备可以共享连续记忆，AI能理解长期关系、偏好、情绪和生活情境。所以，记忆作为infra在底层是统一的，但呈现给用户时一定是具体应用。

爱分析：会有那种穿戴式的记录生活的相机？它本质上是一个记忆。占超群：会有，但我要补一句：记录不等于记忆。穿戴式设备可以产生大量原始记录，比如图像、声音、位置、事件流。但真正的记忆要做选择、抽象、关联、遗忘和召回。人类记忆不是硬盘录像，AI记忆也不应该只是无差别录制。比如一个生活相机记录了你一天发生的事情，记忆层要判断哪些是重要事件，哪些只是噪声；哪些涉及隐私，哪些可以被未来任务调用；哪些需要和家庭、工作、健康或情绪状态关联。只有完成这些处理，它才从“记录系统”变成“记忆系统”。

爱分析：玩具的记忆是类似于个人的世界观，跟企业的记忆相比，是一套同样的体系，还是有明显区别？占超群：底层框架有共通之处，但记忆类型和约束差异很大。企业记忆强调行动、准确性、权限、合规、可解释和可回滚。它的目标是帮助 AI 做对事，尤其是高价值生产力任务。玩具和C端硬件记忆更强调连续关系、情绪、世界观、人设、跨端体验和响应速度。比如同一个孩子有10个玩具，他希望这些玩具共享一个连续记忆；玩具今天听到的故事，明天在游戏里还能延续。这里还涉及语义、情绪、关系、过程和多模态情境。如果进一步到机器人，还会有行动记忆、空间记忆、3D语义图谱、身体状态和环境交互记忆。它和企业记忆共享“长期状态管理”的底座，但上层类型差异很大。

爱分析：这么说，针对B端和C端，完全就两套不同的产品？占超群：不是完全两套产品，而是一套架构、不同记忆类型、不同治理策略。企业侧偏准确、权限、审计、私有化和业务闭环；C端偏低延迟、情绪连续性、跨设备、个性化和体验自然度。B端可以为了准确性慢一点，C端很多交互必须非常快，否则用户体验会断掉。所以底层是统一的：多模态理解、实体事件建模、记忆召回、版本、冲突、权限、生命周期。但配置、优化目标和产品形态会不同。

爱分析：这些是企业和个人都共通的点？

占超群：共通的是记忆框架：事实、事件、偏好、关系、行动、反思、世界观、情绪或情感状态，都可以作为不同类型的记忆被管理。不同的是权重。企业场景里，事实、证据、权限、流程和决策轨迹权重更高；个人和硬件场景里，关系、情绪、世界观、习惯和跨端连续性权重更高。我们会用Builder体系来适配不同数据源和应用形态。你可以把它理解为：底层是一套记忆操作系统，上层按场景装不同的“记忆应用”和“记忆类型”。

爱分析：记忆类型，现在是一个成熟的体系吗？或者说未来会有比较大的变化，导致底层的产品还需要大的迭代？

占超群：这个领域还没有完全成熟，我不想把话说满。现在行业对记忆类型的定义还在快速演化。我们已经看到很多类型：事实记忆、偏好记忆、事件流、决策轨迹、行动记忆、情绪记忆、反思记忆、世界观记忆、实体关系记忆、项目记忆、会话记忆等。不同智能体和不同场景对粒度要求也不同，有的按用户，有的按项目，有的按agent，有的按session，有的需要隔离共享，有的需要time travel和多版本冲突。我们从第一天设计架构时，就尽量避免把系统写死成某几类记忆。底层要支持扩展，因为未来一定会出现今天还没完全定义清楚的新记忆类型。

爱分析：怎么看待开源？通过开源去开拓市场，价值有多大？

占超群：我们会推进开源，但会比较克制地设计边界。记忆是一个需要生态共识的领域。开源对开发者教育、接口标准、连接器生态、评测基准和最佳实践都有价值。尤其在行业早期，大家需要看到可运行的参考架构，而不是只听概念。但企业级记忆真正难的部分，除了代码，还有数据理解能力、工程稳定性、部署能力、安全治理、权限体系、客户场景沉淀和持续运营。这些不是把代码放出来就自动解决的。所以，我们会把开源作为生态建设和标准推动的重要方式，但商业价值仍然来自企业级可靠性和场景深度。

爱分析：现在做记忆的厂商没那么多，是因为大家还没看到机会点？

占超群：一部分原因是市场认知还没有完全到位，另一部分原因是这件事确实比看起来难。现在很多人把记忆理解为“聊天记录摘要”或“RAG的一个模块”。如果只是这个层面，门槛似乎不高。但真正到企业生产力场景，问题会迅速复杂起来：文档理解、多模态表征、权限、冲突、版本、溯源、长期评测、成本、私有化部署，每一项都不是轻量功能。另外，很多公司是在具体任务里做一个特定记忆模块，还没有抽象成标准化基础设施。这个阶段有点像早期大数据：2007、2008年前后大家都在处理海量数据，只是当时还没有形成统一语言和成熟平台。

爱分析：离共识还比较远。

占超群：是的，但我认为方向上的共识会比大家想象得来得快。今天行业分歧主要在三个层面：第一，记忆到底是产品功能还是基础设施；第二，记忆和RAG、知识库、长上下文的边界在哪里；第三，企业级记忆的评测和治理标准怎么建立。随着更多真实场景落地，大家会逐渐意识到：记忆不是“模型背后的一个小功能”，而是智能体能不能进入生产力场景的关键前提。共识不是靠定义争出来的，而是靠场景跑出来的。

06、70%硬件投入，记忆所需的硬件比例比普通的AI应用要高得多

爱分析：从企业的infra角度出发，记忆会挤占掉原来很多知识和数据作为底座的价值？

占超群：我会说是价值重心会重新分配，而不是简单挤占。知识库、RAG、数据仓库、数据湖、数据中台都不会凭空消失。它们仍然是企业数据资产的重要组成部分。但在AI时代，企业需要一层面向智能体的记忆基础设施，把这些资产组织成AI可以长期使用、动态更新、可治理、可计算的状态。因此，RAG会从独立产品形态逐步变成记忆层里的检索原语；知识库会成为记忆层的来源之一；数据平台会继续作为底层事实源和治理底座存在。记忆层不是消灭它们，而是把它们重新编排到AI的任务闭环里。

爱分析：展开讲讲。

占超群：RAG的原始思想非常重要：把模型的参数化知识和外部非参数化知识结合起来，通过检索增强生成能力。但企业级应用走深以后，单纯RAG会暴露几个问题。第一，它通常是静态读多、动态写少。企业知识是不断变化的，人的经验、项目进展、客户承诺、审批口径都在变。如果系统不能写、不能改、不能追溯，就很难支撑长期任务。第二，RAG更多是“给问题找资料”，但企业决策需要“围绕任务组织证据”。这中间涉及多轮探索、假设验证、跨系统计算、冲突处理和结果复盘。第三，RAG往往以文档或片段为中心，而记忆要以实体、事件、关系和决策轨迹为中心。人使用知识不是一次搜索，而是一整套复杂过程。第四，企业知识天然多模态。文档、表格、图像、音频、视频、数据库、代码、聊天记录都可能是证据。只把文本切块存向量，远远不够。所以我认为，RAG不会消失，但会被记忆层内化。它是记忆系统中的检索能力，而不是企业AI的完整答案。

爱分析：RAG更像是一个一次性的，记忆是一个可进化的，是一个持续能解决问题、适应最新环境的？

占超群：可以这么理解，但我会稍微修正一下：RAG本身也可以做工程化更新，并不一定只能一次性。但它的核心仍然是检索增强，天然更偏“读”。记忆的核心是状态演化。它不仅要读，还要写；不仅要召回，还要判断是否过期；不仅要找相似内容，还要处理冲突、版本、生命周期和适用范围。RAG是以检索为核心的查询，记忆是由AI思考力驱动的状态管理和任务执行。这个差异会随着场景复杂度上升变得非常明显。

爱分析：企业用户确实对于AI自主规划的理解和认知还是有很大的一个问号，反正工作流是最直接的，即使到现在，大部分企业也不会觉得自主规划的工作流能占主流。

占超群：这个担心是合理的。企业不会因为一个AI看起来会规划，就把核心流程全部交出去。我认为自主规划进入企业，会经历几个阶段。第一阶段是辅助式，AI帮人找资料、做分析、给建议。第二阶段是受控执行，AI在明确权限和边界内完成部分任务。第三阶段才是更高比例的闭环智能体，但也一定有审计、回滚和人工干预机制。记忆在这里的作用，是给自主规划装上“轨道”。它告诉AI过去类似任务怎么做，哪些规则不能碰，哪些数据可信，哪些动作需要审批，哪里容易出错。没有记忆的自主规划很容易飘；有了决策轨迹和组织约束，AI才可能在企业里逐步承担更复杂任务。所以，未来不是工作流突然消失，而是工作流从硬编码流程，逐步演化为“规则流程 + 记忆约束 + 智能规划”的混合形态。

爱分析：从商业化落地角度，记忆是按应用还是按infra，拿客户的哪一部分预算？占超群：两种都有，取决于客户成熟度和采购方式。对于某些大型办公软件或平台型客户，更容易以infra方式接入，通过API、SDK或平台能力嵌入到自己的产品和智能体体系里。对于央国企、运营商和大型集团，往往是“基座 + 应用”一起采购。客户既需要底层记忆平台，也需要上层决策智能体、分析助手或业务应用，否则单独买infra很难快速产生业务价值。预算来源也会混合：AI基础设施预算、数据平台预算、知识管理预算、业务应用预算，甚至部分会进入数字化转型或经营分析专项。企业真正关心的不是这个预算叫什么，而是它能不能沉淀长期资产、提升任务成功率、降低试错成本。

爱分析：介绍下实际的落地案例。占超群：可以讲两个典型方向。第一类是某大型央企的项目分析和季度经营分析。每个季度要汇总大量材料，包括邮件、Excel、PDF、Word、项目报告、行业资料等。客户希望按公司、项目、行业、风险维度串起来，做风险评估、运营管理、行业判断和后续行动建议。这个场景用普通RAG很难做好，因为它不是单文档问答，而是跨材料、跨时间、跨组织的综合决策。第二类是某大型运营商场景。运营商有大量策略文档、经营数据、数仓数据和业务系统数据。以前经分更多是回答“发生了什么”，比如KPI为什么没完成、哪个区域下降了。现在客户更关心“下一步该怎么做”，比如套餐策略怎么调、渠道动作怎么排、用户流失怎么干预。这就从分析走向决策，需要记忆把历史策略、执行过程和结果反馈串起来。这两个场景的共同点是：数据量大、来源复杂、准确性要求高、决策链长。它们正是企业级记忆最能体现价值的地方。

爱分析：像这类央国企项目，如果把Infra和应用包在一起，整体的预算大概在什么级别？软件和硬件的比例是多少？

占超群：从我们目前服务的重型客户看，一个完整项目如果包含infra和上层应用，软件侧可能在几百万元级，典型重型部署大概在300万元左右；如果算上硬件，总体可能接近千万元级。当然，这不是标准报价，不同客户的数据规模、部署环境和场景复杂度差异很大。硬件占比可能到70%左右，比普通AI应用更高。原因是记忆infra要做大规模数据编排和多模态模型加工。很多大客户一个文档就几千页，历史材料数量非常大。要把它们分布式并行解析、理解、索引和计算，GPU、存储和网络资源都要上去。但客户算的不是一次性软硬件账，而是长期能力账。更重要的是，在合规授权和组织治理前提下，把长期项目中被验证的判断依据、处理路径和复盘结果，转化为可复用的组织最佳实践。它的价值体现为降低重复试错、缩短新人熟悉业务的周期、提升跨团队协同一致性，并让关键经验随业务演化持续累积。

爱分析：2026年，质变科技有什么规划和目标？

占超群：2026年我们会沿着三个方向推进。第一，继续扩展多模态记忆能力，特别是面向C端情感情绪、AI潮玩、AI硬件和具身智能的记忆类型。机器人和硬件场景会引入更多空间、行动、情绪和长期关系记忆。第二，深化数据理解和多模态理解模型能力。企业级记忆的地基是理解准确率，文档、表格、图像、视频、代码、工单等理解得越准，后面的记忆计算和智能体执行才越可靠。第三，继续打通主流大模型和智能体生态。我们会支持更多国外和国内模型、agent框架、办公系统、IM系统和企业数据源，让记忆成为跨模型、跨应用的基础设施。总体目标很明确：让记忆从一个新概念，变成企业AI落地中真正可复用、可验证、可治理的底座。

爱分析：记忆领域，国外有哪些不错的厂商？

占超群：国外有一些值得关注的方向，但不同公司切入点不同。从data infra角度看，Databricks这类公司有机会，因为它们在数据平台、治理、企业客户和生态上有积累。如果把AI记忆理解成数据智能平台向智能体时代的延伸，它们具备一定基础。另外，Mem0、Zep、Letta这些公司和项目在开发者记忆、agent memory、时序知识图谱、MemGPT工程化等方向上都做了探索，值得尊重。但我会说，它们和我们关注的企业生产力场景还不完全是同一层级的问题。我们要啃的是更重的场景：数据规模更大、准确性要求更高、权限和合规更复杂、部署环境更严格，真正同时具备data infra、多模态模型、记忆管理和记忆计算能力的公司，全球范围内都不会太多。我不想把话说得太绝对，因为这个领域还在早期。但我们判断，未来能跑出来的记忆公司，一定不是只做一个聊天摘要功能，而是能成为AI时代数据基础设施的一部分。