RAG

加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

RAG(Retrieval-Augmented Generation),是一种结合信息检索(IR)和生成式模型的技术框架。

RAG(Retrieval-Augmented Generation),是一种结合信息检索(IR)和生成式模型的技术框架。收起

查看更多
  • 一文搞懂GraphRAG和LightRAG:选型、难点、增量更新实战教程
    上一篇讲的是「传统 RAG」(也叫 Naive RAG),核心思路是:把文档切成块(Chunk)→ 做向量化(Embedding)→ 存入向量数据库 → 查询时基于语义相似度检索 Top-K 个文本块 → 塞给大模型生成答案。
    1774
    04/23 10:22
    RAG
    一文搞懂GraphRAG和LightRAG:选型、难点、增量更新实战教程
  • 多模态大模型+RAG的行业巡检缺陷智能识别与诊断系统平台
    应用案例 北京华盛恒辉科技和北京五木恒润科技推出的多模态大模型与RAG融合的行业巡检缺陷智能识别与诊断系统,广泛适用于各行业等领域,可出色完成多模态大模型与RAG融合的行业巡检缺陷智能识别与诊断系统重构任务。可以针对不同用户实际使用场景需求定制。 一、技术原理:多模态大模型与RAG协同机制 多模态大模型:融合文本、图像、视频、音频、时序信号(如振动、温度)等多源数据,通过模态编码器将异构信息映射至
  • ChatGPT 5.4 如何实现多模态跃迁?深度技术拆解
    在 AI 领域迭代至 2026 年的背景下, 5.4(基于 GPT-5 架构的进阶版)代表了生成式 AI 从“概率预测”向“逻辑推理”的质变。对于国内用户而言,想要深度体验这一代模型的核心能力,目前最稳妥的路径是通过 KULAAI (k.kulaai.cn) 等聚合平台。该平台在国内可直接访问,通过 中转技术整合了 GPT架构、Claude 及 Gemini Pro,网络通畅即可使用,无需特殊网络
    1212
    04/18 16:56
  • 万字长文|RAG全解析:文档切割、多路召回、向量数据库选型
    最近收到不少读者的催促,希望能够了解更多关于RAG的相关知识。RAG已成为面试中的一个重要考点,但许多人对其理解仍停留在“给大模型外挂一个知识库”的表面层次。实际上,RAG有着更为复杂的流程和众多细节需要掌握。 为了帮助大家更好地理解和掌握RAG的相关知识,我整理了一些近期大厂高频出现的RAG面试题: 1. **什么是RAG?** - RAG的全称是Retrieval-Augmented Generation,意思是“检索增强生成”。核心思想是先从外部知识库中检索出与用户问题相关的资料,然后将这些资料作为增强上下文,与用户的问题一起交给大模型进行生成回答。 2. **RAG整体工作流程如何?** - RAG的工作流程分为索引阶段(离线)和查询阶段(在线)。索引阶段主要包括文档加载、切割、向量化和存入向量数据库;查询阶段则包括用户提问向量化、相似度检索、构造增强Prompt和大模型生成回答。 3. **微调和RAG的区别是什么?** - 微调是指对已经预训练好的大模型进行进一步训练,使其在特定领域或任务上表现更好。而RAG则是通过检索外部知识库来增强大模型的回答,无需重新训练模型。 4. **文档切割策略有哪些?** - 文档切割策略主要有固定大小切割、递归字符切割、基于文档结构的切割和语义切割等。每种策略都有其适用场景和优缺点。 5. **Re-rank是什么?** - Re-rank是对检索结果进行重排序的过程,目的是提高检索结果的准确性。它通过Cross-Encoder模型对检索结果进行细化调整,从而提高最终回答的质量。 6. **Embedding有哪些算法?** - Embedding算法的发展历程是从静态词向量到上下文嵌入再到现代的多粒度、多功能和多语言的Embedding模型。 7. **什么是向量数据库?** - 向量数据库用于高效存储和检索向量,支持毫秒级的近似最近邻搜索(ANN)。常用的索引结构包括HNSW、IVF和PQ等。 8. **什么是多路召回?** - 多路召回是指采用多种召回通道(如向量检索、关键词检索和知识图谱检索)并最终合并结果的策略,以提高召回的全面性和准确性。 9. **如何量化RAG的效果?** - RAG的效果可以通过召回率、精确率和NDCG等指标进行评估。此外,还可以通过RAGAS等框架进行详细的评估。 10. **什么是大模型幻觉?如何降低幻觉?** - 大模型幻觉指的是模型自信地说出一些看似合理的但实际上错误的信息。降低幻觉的方法包括Prompt工程约束、输出验证、领域微调和不确定性量化等。 以上就是RAG相关的核心知识点,希望能帮助大家更好地理解和掌握RAG技术。希望通过这次详细解读,大家不仅能应付面试,还能真正理解企业级RAG系统的应用场景和设计思路。
    2765
    04/14 15:05
    RAG
    万字长文|RAG全解析:文档切割、多路召回、向量数据库选型
  • 生成式 AI 帮助工程师挖掘隐藏在非结构化数据中的深层洞察
    您是否知道,生成式 AI(GenAI)可以帮助工程师在几秒钟内诊断汽车故障,甚至在设备出现问题之前预测潜在失效?GenAI 正在通过加速数据分析和算法开发,让这些场景从设想走向现实,使工程师能够充分发挥专业知识,挖掘可执行的洞察。 工程团队每年都会产生数 TB 级的数据。根据 Gartner 的估算,其中多达 80% 属于非结构化数据。服务记录、研究论文和技术人员记录中蕴含着关键的组织知识,但由于
  • RAG、GraphRAG 与本体:大模型迈向认知结构化时代
    随着大模型的应用推广,RAG(向量检索增强生成)逐渐向GraphRAG(图检索增强生成)过渡,后者通过引入知识图谱,显著增强了复杂推理能力和可解释性。然而,GraphRAG面临显著的工程挑战,如图构建质量、检索复杂度和成本等问题。本文探讨了RAG、GraphRAG和本体方法在不同任务场景中的适用性和局限性,并提出了HybridRAG作为折衷解决方案。通过可视分析工具,建议采取三步落地路线:建立最小子图闭环、引入约束和证据锚点、实现时间和权限隔离,最终形成可运营的认知系统。
    6073
    01/12 09:47
    RAG、GraphRAG 与本体:大模型迈向认知结构化时代
  • 利用CXL优化RAG推理效率
    本文探讨了如何利用CXL内存扩展器优化RAG推理效率,重点在于解决RAG技术中的内存挑战,并介绍了一种基于静态profiling的数据与负载分配优化方案。通过实验验证,在不同场景下,CXL内存扩展器显著提升了推理性能和资源利用率。未来研究将进一步探索动态数据放置策略以优化整体性能。
    利用CXL优化RAG推理效率
  • 红帽推出红帽AI 3,将分布式AI推理引入生产级AI工作负载
    红帽混合云原生AI平台简化AI工作流并提供全新强大推理能力,为大规模代理式AI奠定基础,助力IT团队与AI工程师更快、更高效地实现创新 全球领先的开源解决方案提供商红帽公司近日发布红帽AI 3(Red Hat AI 3),标志着其企业级人工智能(AI)平台的重大升级。该平台融合了红帽AI推理服务器、红帽企业Linux AI(RHEL AI)和红帽OpenShift AI的最新创新成果,可简化大规模
  • 红帽推出红帽高级开发者套件,加速应用开发
    新产品将平台工程工具与增强的安全功能相结合,通过增强功能来加快和简化应用开发,并加快红帽AI技术的采用 全球领先的开源解决方案提供商红帽公司近日宣布推出红帽高级开发者套件(Red Hat Advanced Developer Suite),是红帽OpenShift的强大新成员。红帽OpenShift是由Kubernetes驱动的行业领先混合云应用平台,旨在通过增强功能提升开发者生产力与应用安全性,
  • 【一文看懂】什么是RAG:让大模型不再死记硬背,而是学会“查了资料再回答”
    随着大语言模型(LLM)在各个行业的广泛应用,我们不断面对一个挑战:如何确保语言模型的回答不仅仅依赖于它的训练数据,还能灵活地访问外部的、最新的知识库。检索增强生成(Retrieval-Augmented Generation,简称RAG)正是为了解决这个问题而应运而生的技术架构。本文将详细介绍RAG的核心定义、技术框架、应用场景、与相似技术的区别,以及它如何为AI系统带来更高效、更智能的答案生成能力。
    3652
    2025/05/08
    【一文看懂】什么是RAG:让大模型不再死记硬背,而是学会“查了资料再回答”
  • RAG检索不过关?试试这些优化策略,精准度飙升!
    近来,RAG成了大语言模型的“救命稻草”,可让大语言模型回答更准确、更靠谱。可问题来了,很多 RAG 应用的检索系统还是有点“笨”:要么漏掉关键信息,要么抓回一堆无关紧要的“噪声”,搞得最终答案质量参差不齐。
    RAG检索不过关?试试这些优化策略,精准度飙升!
  • RAG检索全攻略:Embedding与Rerank模型的终极指南
    在构建基于检索增强生成(RAG)的系统时,Embedding Model和Rerank Model扮演着至关重要的角色。比如你正在搭建一个智能搜索引擎,Embedding Model就像是帮你快速找到相关书籍的“图书管理员”,而Rerank Model则像是一位经验丰富的“资深书评人”,负责从一堆书里精准挑选出最符合你需求的那几本。两者配合,就像一对完美搭档,确保RAG系统既能找到大量信息,又能精准提炼出最关键的内容。
    RAG检索全攻略:Embedding与Rerank模型的终极指南
  • GitHub上流行的RAG框架介绍及优缺点分析
    随着大型语言模型在自然语言处理中的广泛应用,其固有的知识截止和“幻觉”问题逐渐暴露。为了解决这些问题,检索增强生成(Retrieval-Augmented Generation,简称 RAG) 技术应运而生。RAG 通过将外部知识库中的相关信息检索出来,并将这些信息融合到生成过程的上下文中,从而大幅提高了回答的准确性、时效性以及上下文一致性。这一方法不仅能克服知识截止问题,还能降低模型产生错误或“胡言乱语”的风险。
    GitHub上流行的RAG框架介绍及优缺点分析
  • DeepSeek点燃国产大模型斗志,RAG等核心技术被重估
    黑马DeepSeek-R1的崛起,给外国网友上演了一场来自东方的震撼。一边,OpenAI和Claude都破了大防,一个声讨“窃取”,一个嘲讽“落后”,两家水火不容的对手竟然以这种戏剧性的方式,鲜有地达成了一致。另一边,微软、亚马逊等云服务厂商,甚至英伟达都开启了“真香”模式,你追我赶地在自家云平台上线DeepSeek-R1。
    DeepSeek点燃国产大模型斗志,RAG等核心技术被重估
  • 大模型应用开发-走进 RAG 的世界
    在大模型的快速发展中,许多人被 ChatGPT、Claude 等对话模型惊艳得目瞪口呆。然而,我们稍微深挖就会发现,大模型的“超能力”并不总是那么稳定,有时候它可能信心满满地生成错误答案。于是,一个叫 RAG(Retrieval-Augmented Generation) 的技术应运而生,为大模型的应用开发带来了一次质的飞跃。
    大模型应用开发-走进 RAG 的世界

正在努力加载...