RAG_RAG资讯 - 与非网

RAG必将被吃掉

质变科技创始人占超群在一次深度对话中探讨了AI记忆的重要性及其在企业AI基础设施中的作用。他认为记忆不仅是智能体进化的基础设施，更是企业AI的关键突破口。记忆层需要解决长期状态、动态写入、多源冲突等问题，并且需要中立、可携带、跨模型的特点。此外，他还提到记忆不仅仅是被动存储，而是需要具备计算能力，能够进行近存储计算，从而提高AI的可靠性。记忆层可以帮助企业更好地理解和利用其数据资产，促进智能体在企业生产力场景中的应用。

爱分析ifenxi

397

07/03 08:03

AI RAG

智能体 AI 加持，Arm Metis 升级软件安全漏洞检测能力

作为开源的智能体 AI 安全框架，Arm Metis 支持大规模 AI 驱动的上下文安全分析，助力更早识别软件漏洞、节省时间与成本人工智能 (AI) 时代，现代软件系统依托日趋复杂的代码库、开发框架、运行时环境与程序库而建。随着这类系统的规模化落地，其产品交付前的安全漏洞识别难度也与日俱增。为应对这一挑战，Arm 产品安全团队研发了 Metis 开源项目——一款专为规模化代码库识别复杂安全隐患

与非网编辑

333

06/09 10:50

AI Arm

AI大模型底层原理全解析：从发展史、Transformer到RAG、Agent核心机制

AI 是如何工作的？你以为 AI 像是百度搜索一样的，更准的内容检索吗？但恰恰相反，AI 是一点也不会检索，而是文字接龙，从一个字/词（token）预测下一个字/词（token）。那凭直觉预测（温度），AI 不得是个大傻子？咋那么准呢？

小傅哥

1496

05/25 16:09

AI AI大模型

AI大模型底层原理全解析：从发展史、Transformer到RAG、Agent核心机制

字节面试题｜Claude Code不用RAG用grep？底层设计哲学 + 源码解析

Claude Code 不用 RAG 是基于三层考虑：代码场景下 RAG 有切片破坏结构、向量近似不准、索引滞后等本质问题；Claude Code 用 Grep 加 Glob 加 Read 三件套加上派子 agent 探索的设计，本质上是把检索决策权还给 LLM 自己，配合多轮迭代循环实现精准定位；更深层是 Anthropic 信任 LLM 的能力，押注模型会越来越强，所以选择“不替模型做决定”的设计哲学

小林coding

1371

05/18 15:04

Claude Code RAG

一文搞懂GraphRAG和LightRAG：选型、难点、增量更新实战教程

上一篇讲的是「传统 RAG」（也叫 Naive RAG），核心思路是：把文档切成块（Chunk）→ 做向量化（Embedding）→ 存入向量数据库 → 查询时基于语义相似度检索 Top-K 个文本块 → 塞给大模型生成答案。

小林coding

3297

04/23 10:22

RAG

多模态大模型+RAG的行业巡检缺陷智能识别与诊断系统平台

应用案例北京华盛恒辉科技和北京五木恒润科技推出的多模态大模型与RAG融合的行业巡检缺陷智能识别与诊断系统，广泛适用于各行业等领域，可出色完成多模态大模型与RAG融合的行业巡检缺陷智能识别与诊断系统重构任务。可以针对不同用户实际使用场景需求定制。一、技术原理：多模态大模型与RAG协同机制多模态大模型：融合文本、图像、视频、音频、时序信号（如振动、温度）等多源数据，通过模态编码器将异构信息映射至

eefocus_4188661

1318

04/21 09:26

大模型智能巡检

万字长文｜RAG全解析：文档切割、多路召回、向量数据库选型

最近收到不少读者的催促，希望能够了解更多关于RAG的相关知识。RAG已成为面试中的一个重要考点，但许多人对其理解仍停留在“给大模型外挂一个知识库”的表面层次。实际上，RAG有着更为复杂的流程和众多细节需要掌握。为了帮助大家更好地理解和掌握RAG的相关知识，我整理了一些近期大厂高频出现的RAG面试题： 1. **什么是RAG？** - RAG的全称是Retrieval-Augmented Generation，意思是“检索增强生成”。核心思想是先从外部知识库中检索出与用户问题相关的资料，然后将这些资料作为增强上下文，与用户的问题一起交给大模型进行生成回答。 2. **RAG整体工作流程如何？** - RAG的工作流程分为索引阶段（离线）和查询阶段（在线）。索引阶段主要包括文档加载、切割、向量化和存入向量数据库；查询阶段则包括用户提问向量化、相似度检索、构造增强Prompt和大模型生成回答。 3. **微调和RAG的区别是什么？** - 微调是指对已经预训练好的大模型进行进一步训练，使其在特定领域或任务上表现更好。而RAG则是通过检索外部知识库来增强大模型的回答，无需重新训练模型。 4. **文档切割策略有哪些？** - 文档切割策略主要有固定大小切割、递归字符切割、基于文档结构的切割和语义切割等。每种策略都有其适用场景和优缺点。 5. **Re-rank是什么？** - Re-rank是对检索结果进行重排序的过程，目的是提高检索结果的准确性。它通过Cross-Encoder模型对检索结果进行细化调整，从而提高最终回答的质量。 6. **Embedding有哪些算法？** - Embedding算法的发展历程是从静态词向量到上下文嵌入再到现代的多粒度、多功能和多语言的Embedding模型。 7. **什么是向量数据库？** - 向量数据库用于高效存储和检索向量，支持毫秒级的近似最近邻搜索（ANN）。常用的索引结构包括HNSW、IVF和PQ等。 8. **什么是多路召回？** - 多路召回是指采用多种召回通道（如向量检索、关键词检索和知识图谱检索）并最终合并结果的策略，以提高召回的全面性和准确性。 9. **如何量化RAG的效果？** - RAG的效果可以通过召回率、精确率和NDCG等指标进行评估。此外，还可以通过RAGAS等框架进行详细的评估。 10. **什么是大模型幻觉？如何降低幻觉？** - 大模型幻觉指的是模型自信地说出一些看似合理的但实际上错误的信息。降低幻觉的方法包括Prompt工程约束、输出验证、领域微调和不确定性量化等。以上就是RAG相关的核心知识点，希望能帮助大家更好地理解和掌握RAG技术。希望通过这次详细解读，大家不仅能应付面试，还能真正理解企业级RAG系统的应用场景和设计思路。

小林coding

4863

04/14 15:05

RAG

生成式 AI 帮助工程师挖掘隐藏在非结构化数据中的深层洞察

您是否知道，生成式 AI（GenAI）可以帮助工程师在几秒钟内诊断汽车故障，甚至在设备出现问题之前预测潜在失效？GenAI 正在通过加速数据分析和算法开发，让这些场景从设想走向现实，使工程师能够充分发挥专业知识，挖掘可执行的洞察。工程团队每年都会产生数 TB 级的数据。根据 Gartner 的估算，其中多达 80% 属于非结构化数据。服务记录、研究论文和技术人员记录中蕴含着关键的组织知识，但由于

与非网编辑

957

02/25 10:00

传感器生成式AI

RAG、GraphRAG 与本体：大模型迈向认知结构化时代

随着大模型的应用推广，RAG（向量检索增强生成）逐渐向GraphRAG（图检索增强生成）过渡，后者通过引入知识图谱，显著增强了复杂推理能力和可解释性。然而，GraphRAG面临显著的工程挑战，如图构建质量、检索复杂度和成本等问题。本文探讨了RAG、GraphRAG和本体方法在不同任务场景中的适用性和局限性，并提出了HybridRAG作为折衷解决方案。通过可视分析工具，建议采取三步落地路线：建立最小子图闭环、引入约束和证据锚点、实现时间和权限隔离，最终形成可运营的认知系统。

AI先锋洞察

6512

01/12 09:47

大模型 RAG

利用CXL优化RAG推理效率

本文探讨了如何利用CXL内存扩展器优化RAG推理效率，重点在于解决RAG技术中的内存挑战，并介绍了一种基于静态profiling的数据与负载分配优化方案。通过实验验证，在不同场景下，CXL内存扩展器显著提升了推理性能和资源利用率。未来研究将进一步探索动态数据放置策略以优化整体性能。

智能计算芯世界

880

2025/11/12

CXL RAG

红帽推出红帽AI 3，将分布式AI推理引入生产级AI工作负载

红帽混合云原生AI平台简化AI工作流并提供全新强大推理能力，为大规模代理式AI奠定基础，助力IT团队与AI工程师更快、更高效地实现创新全球领先的开源解决方案提供商红帽公司近日发布红帽AI 3（Red Hat AI 3），标志着其企业级人工智能（AI）平台的重大升级。该平台融合了红帽AI推理服务器、红帽企业Linux AI（RHEL AI）和红帽OpenShift AI的最新创新成果，可简化大规模

与非网编辑

1299

2025/10/15

NVIDIA 混合云

红帽推出红帽高级开发者套件，加速应用开发

新产品将平台工程工具与增强的安全功能相结合，通过增强功能来加快和简化应用开发，并加快红帽AI技术的采用全球领先的开源解决方案提供商红帽公司近日宣布推出红帽高级开发者套件（Red Hat Advanced Developer Suite），是红帽OpenShift的强大新成员。红帽OpenShift是由Kubernetes驱动的行业领先混合云应用平台，旨在通过增强功能提升开发者生产力与应用安全性，

与非网编辑

678

2025/05/26

AI应用开发者

【一文看懂】什么是RAG：让大模型不再死记硬背，而是学会“查了资料再回答”

随着大语言模型（LLM）在各个行业的广泛应用，我们不断面对一个挑战：如何确保语言模型的回答不仅仅依赖于它的训练数据，还能灵活地访问外部的、最新的知识库。检索增强生成（Retrieval-Augmented Generation，简称RAG）正是为了解决这个问题而应运而生的技术架构。本文将详细介绍RAG的核心定义、技术框架、应用场景、与相似技术的区别，以及它如何为AI系统带来更高效、更智能的答案生成能力。

超算百科

3295

2025/05/08

大模型 RAG

RAG检索不过关？试试这些优化策略，精准度飙升！

近来，RAG成了大语言模型的“救命稻草”，可让大语言模型回答更准确、更靠谱。可问题来了，很多 RAG 应用的检索系统还是有点“笨”：要么漏掉关键信息，要么抓回一堆无关紧要的“噪声”，搞得最终答案质量参差不齐。

写代码的中年人

2045

2025/03/26

大型语言模型 RAG

RAG检索全攻略：Embedding与Rerank模型的终极指南

在构建基于检索增强生成（RAG）的系统时，Embedding Model和Rerank Model扮演着至关重要的角色。比如你正在搭建一个智能搜索引擎，Embedding Model就像是帮你快速找到相关书籍的“图书管理员”，而Rerank Model则像是一位经验丰富的“资深书评人”，负责从一堆书里精准挑选出最符合你需求的那几本。两者配合，就像一对完美搭档，确保RAG系统既能找到大量信息，又能精准提炼出最关键的内容。

写代码的中年人

5786

2025/03/19

RAG

GitHub上流行的RAG框架介绍及优缺点分析

随着大型语言模型在自然语言处理中的广泛应用，其固有的知识截止和“幻觉”问题逐渐暴露。为了解决这些问题，检索增强生成（Retrieval-Augmented Generation，简称 RAG）技术应运而生。RAG 通过将外部知识库中的相关信息检索出来，并将这些信息融合到生成过程的上下文中，从而大幅提高了回答的准确性、时效性以及上下文一致性。这一方法不仅能克服知识截止问题，还能降低模型产生错误或“胡言乱语”的风险。

写代码的中年人

5731

2025/02/17

GitHub RAG

DeepSeek点燃国产大模型斗志，RAG等核心技术被重估

黑马DeepSeek-R1的崛起，给外国网友上演了一场来自东方的震撼。一边，OpenAI和Claude都破了大防，一个声讨“窃取”，一个嘲讽“落后”，两家水火不容的对手竟然以这种戏剧性的方式，鲜有地达成了一致。另一边，微软、亚马逊等云服务厂商，甚至英伟达都开启了“真香”模式，你追我赶地在自家云平台上线DeepSeek-R1。

量子位

374

2025/02/05

大模型 DeepSeek

大模型应用开发-走进 RAG 的世界

在大模型的快速发展中，许多人被 ChatGPT、Claude 等对话模型惊艳得目瞪口呆。然而，我们稍微深挖就会发现，大模型的“超能力”并不总是那么稳定，有时候它可能信心满满地生成错误答案。于是，一个叫 RAG（Retrieval-Augmented Generation）的技术应运而生，为大模型的应用开发带来了一次质的飞跃。

写代码的中年人

2541

2024/11/21

大模型生成式AI