扫码加入

RAG

加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

RAG(Retrieval-Augmented Generation),是一种结合信息检索(IR)和生成式模型的技术框架。

RAG(Retrieval-Augmented Generation),是一种结合信息检索(IR)和生成式模型的技术框架。收起

查看更多
  • RAG、GraphRAG 与本体:大模型迈向认知结构化时代
    随着大模型的应用推广,RAG(向量检索增强生成)逐渐向GraphRAG(图检索增强生成)过渡,后者通过引入知识图谱,显著增强了复杂推理能力和可解释性。然而,GraphRAG面临显著的工程挑战,如图构建质量、检索复杂度和成本等问题。本文探讨了RAG、GraphRAG和本体方法在不同任务场景中的适用性和局限性,并提出了HybridRAG作为折衷解决方案。通过可视分析工具,建议采取三步落地路线:建立最小子图闭环、引入约束和证据锚点、实现时间和权限隔离,最终形成可运营的认知系统。
    3096
    01/12 09:47
    RAG、GraphRAG 与本体:大模型迈向认知结构化时代
  • 利用CXL优化RAG推理效率
    本文探讨了如何利用CXL内存扩展器优化RAG推理效率,重点在于解决RAG技术中的内存挑战,并介绍了一种基于静态profiling的数据与负载分配优化方案。通过实验验证,在不同场景下,CXL内存扩展器显著提升了推理性能和资源利用率。未来研究将进一步探索动态数据放置策略以优化整体性能。
    利用CXL优化RAG推理效率
  • 红帽推出红帽AI 3,将分布式AI推理引入生产级AI工作负载
    红帽混合云原生AI平台简化AI工作流并提供全新强大推理能力,为大规模代理式AI奠定基础,助力IT团队与AI工程师更快、更高效地实现创新 全球领先的开源解决方案提供商红帽公司近日发布红帽AI 3(Red Hat AI 3),标志着其企业级人工智能(AI)平台的重大升级。该平台融合了红帽AI推理服务器、红帽企业Linux AI(RHEL AI)和红帽OpenShift AI的最新创新成果,可简化大规模
  • 红帽推出红帽高级开发者套件,加速应用开发
    新产品将平台工程工具与增强的安全功能相结合,通过增强功能来加快和简化应用开发,并加快红帽AI技术的采用 全球领先的开源解决方案提供商红帽公司近日宣布推出红帽高级开发者套件(Red Hat Advanced Developer Suite),是红帽OpenShift的强大新成员。红帽OpenShift是由Kubernetes驱动的行业领先混合云应用平台,旨在通过增强功能提升开发者生产力与应用安全性,
  • 【一文看懂】什么是RAG:让大模型不再死记硬背,而是学会“查了资料再回答”
    随着大语言模型(LLM)在各个行业的广泛应用,我们不断面对一个挑战:如何确保语言模型的回答不仅仅依赖于它的训练数据,还能灵活地访问外部的、最新的知识库。检索增强生成(Retrieval-Augmented Generation,简称RAG)正是为了解决这个问题而应运而生的技术架构。本文将详细介绍RAG的核心定义、技术框架、应用场景、与相似技术的区别,以及它如何为AI系统带来更高效、更智能的答案生成能力。
    3216
    2025/05/08
    【一文看懂】什么是RAG:让大模型不再死记硬背,而是学会“查了资料再回答”