腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
视频
用户
沙龙
专栏
专区
综合排序
丨
最热优先
丨
最新优先
时间不限
RAG
作者:
RAG
已死,
RAG
万岁!
一个具有更大上下文窗口的新模型问世,社交媒体上便会充斥着“
RAG
已死”的宣言。
RAG
的初衷 五年前,我在 Meta 基础人工智能研究中心(FAIR,前身为 Facebook 人工智能研究中心)的团队提出了
RAG
(Retrieval-Augmented Generation,检索增强生成 底线是:您同时需要长上下文 LLM 和
RAG
。 但既然“
RAG
”这个术语似乎如此具有争议性,那我们不妨这样说: 我们不必非得称之为
RAG
。 我们可以就叫它 检索 (retrieval)。
RAG
提供了相当于直接翻到相关页面的能力。处理更多 token 不仅更慢,而且极其低效,并且比使用
RAG
精准定位所需信息要昂贵得多。
RAG
、微调和大型上下文窗口在 AI 中也是如此。 结论 我们不需要在
RAG
与长上下文窗口、微调或 MCP 之间做出选择。
Datawhale
2025-04-24
801
0
标签:
人工智能
工具
模型
数据
系统
【
RAG
】001-
RAG
概述
【
RAG
】001-
RAG
概述 0、整体思维导图 下面的知识是基于一个视频教程结合 AI 生成的笔记,我也看了一遍,有了一些印象,但这种印象很快就会消失,知识也就消失了,为了使得知识在我的大脑中停留更长的时间 补充1:
RAG
基本逻辑 补充2:
RAG
知识库基本逻辑 一、
RAG
介绍 1、LLM 的主要局限性 大语言模型(LLM)尽管功能强大,但仍存在以下明显的局限性: 时效性问题:模型的知识在预训练后就固定了 概述 1、
RAG
的概念
RAG
(Retrieval-Augmented Generation,检索增强生成)是一种结合了检索和生成技术的文本处理方法,主要用于提高语言模型的输出质量。 2、
RAG
的工作原理
RAG
的核心工作流程包含以下步骤: 知识库构建: 收集和处理文档资料 将文档切分为适当大小的文本块 使用向量化模型将文本转换为向量并存储 检索过程: 接收用户查询并向量化 在向量数据库中搜索相似内容 获取最相关的文本片段 生成过程: 将检索到的相关内容与用户问题组合 构建合适的提示词(Prompt) 通过 LLM 生成最终答案 3、
RAG
的应用场景
RAG
技术在多个领域都有广泛应用
訾博ZiBo
2025-03-25
851
0
标签:
索引
优化
量化
模型
数据
RAG
系列 02 — Advanced
RAG
系列说明:这是
RAG
工程化系列第二篇。第一篇我们拆了NaiveRAG的8颗雷,得出一个反直觉的结论:90%的"模型不够好",其实是"工程没做好"。 配套阅读:《
RAG
系列01—NaiveRAG》《从NaiveRAG到AgenticRAG》引言:2025年3月,我参加了一家toBSaaS公司的技术评审会。那天的议题是"
RAG
系统下一阶段升级路线"。 这就是AdvancedRAG的真实威力——它是整条
RAG
演进光谱上ROI最高的一站,但也是最容易被跳过的一站。 AdvancedRAG的本质,是把
RAG
从"一锤子买卖"重构为"多阶段管道"。 下一篇预告:《
RAG
系列03—ModularRAG:当一条流水线装不下你的业务》
技术方舟
2026-06-09
184
0
标签:
合肥同盟
RAG
系列 01 — Naive
RAG
系列说明:这是
RAG
工程化系列第一篇,目标是把四代
RAG
(NaiveAdvancedModular/Agentic)逐一拆透。每篇聚焦一种范式,讲它真正能做什么、做不到什么、工程上怎么落地。 一、NaiveRAG到底是什么:先把定义讲清楚,否则后面全是糊涂账打开任何一篇
RAG
教程,你会看到几乎一样的描述:"
RAG
就是先检索再生成"。这种描述等于没说。 但这一行决定了你的
RAG
准确率上限。PDF是NaiveRAG的头号杀手。 这一段代码能解决
RAG
项目里50%的"幻觉投诉"。零模型成本、立竿见影。 留给读者的两个问题:你正在做的
RAG
项目,8颗雷里你已经踩了几颗?
技术方舟
2026-05-23
361
0
标签:
合肥同盟
RAG
系列 03 — Modular
RAG
系列说明:这是
RAG
工程化系列第三篇。前两篇我们完成了从Naive到Advanced的进化——把基础工程做到极致,把准确率从38%推到87%。 配套阅读:《
RAG
系列01—NaiveRAG》《
RAG
系列02—AdvancedRAG》《从NaiveRAG到AgenticRAG》引言:那个"if-else套了11层"的
RAG
项目2024年底,我帮一家金融科技公司做
RAG
系统的codereview。 这就是ModularRAG真正的价值——它不是为了更高的准确率,是为了让你的
RAG
系统在业务复杂度爆炸时不崩盘。 ModularRAG的本质,是把
RAG
从"线性管道"升级为"模块化图(Graph)"。
技术方舟
2026-06-11
96
0
标签:
合肥同盟
rag
RAG
技术全面解析:原理、应用与优势 引言 在当今快速发展的人工智能领域,检索增强生成(Retrieval-Augmented Generation,
RAG
)技术已成为一个备受关注的话题。
RAG
工作流程
RAG
的工作流程可以分为以下几个步骤: 用户查询:用户提出一个查询,系统首先会将这个查询传递给检索模型。
RAG
技术的应用场景
RAG
技术在众多实际应用场景中显示出其独特的优势,这是其他单一技术难以比拟的。下面我们详细探讨
RAG
技术的几个主要应用场景。
RAG
技术可以在知识图谱构建过程中发挥重要作用。通过利用检索模型从大规模文档库中找到最新的相关信息,
RAG
系统可以识别出新的实体和关系。
RAG
技术的优势与挑战
RAG
技术在很多方面展示了其显著的优势,但它也面临着一些挑战。以下我们将详细探讨
RAG
技术的优势和挑战。
DC童生
2024-06-27
665
0
标签:
架构
模型
数据
系统
RAG
Logger:
RAG
日志记录工具
您听说过
RAG
Logger 吗? 它是一款专为检索增强生成 (
RAG
) 应用程序设计的开源日志记录工具! 据说它可以作为 LangSmith 的轻量级替代方案,满足
RAG
特定的日志记录需求。 查询、搜索结果、LLM 交互和性能指标可以以 JSON 格式记录。 特点 通过查询跟踪详细了解用户问题!
RAG
Logger 为
RAG
应用程序的性能监控和调试提供了强大的支持,对吗? 特别推荐给那些想要提高应用程序开发效率的人。 请参阅此处的详细信息:
RAG
Logger GitHub 仓库
致Great
2025-01-07
362
0
标签:
优化
工具
日志
搜索
性能监控
独家 | 进阶
RAG
-提升
RAG
效果
在我的上一篇博客中,我深入地介绍了
RAG
以及它是如何用LlamaIndex实现的。然而,
RAG
在回答问题时经常遇到许多挑战。
RAG
工作流程分解 首先,为了增强对
RAG
的理解,我们将
RAG
工作流程分解为三个部分,并对每个部分进行优化以提高整体表现。 模块化
RAG
模块化
RAG
集成了多种方法来增强
RAG
的不同组成部分,如在检索器中加入相似度检索的搜索模块和应用微调方法
RAG
融合(
RAG
Fusion) RA融合技术结合了两种方法: 多查询检索 利用 总结 本文讨论了优化
RAG
管道各部分和增强整体
RAG
流水线的各种技术。您可以在您的
RAG
流水线中使用这些技术中的一种或多种,从而使其更加准确和高效。 原文标题:Advance
RAG
- Improve
RAG
performance 副标题:Ultimate guide to optimise
RAG
pipeline from zero to advance
数据派THU
2024-06-28
1.7K
0
标签:
优化
模型
数据
搜索
压缩
什么是
RAG
,为什么要用
RAG
?
为什么要用
RAG
?
RAG
引用信息来源是用户可以核实答案,因此其透明透非常高,这增强了人们对模型输出结果的信任。 透过获取与特定领域数据,
RAG
能够为不同领域提供专业的知识支持,定制能力非常高。 由于
RAG
不需更新模型参数,因此在处理大规模数据集时,经济效率方面更具优势。 不过虽然
RAG
有许多优势在,但这3种方法并不是互斥的,反而是相辅相成的。 什么是
RAG
? 这篇章旨在介绍
RAG
的过程与其使用的相关技术。
RAG
生态系
RAG
的生态系蓬勃发展,在水平领域,从最初的文本问答领域以外,
RAG
的应用逐渐拓展到更多模态数据,包括图像、代码、结构化知识、影音等。 在这些领域,已经涌现许多相关研究成果。
用户1418987
2024-09-06
784
0
标签:
数据
系统
优化
企业
模型
RAG
实战|8种
RAG
架构浅析
Naive
RAG
简介: Naive
RAG
是最基础的检索增强生成架构,采用“索引-检索-生成”的经典流程。 Corrective
RAG
简介: Corrective
RAG
在传统
RAG
基础上引入了文档质量评估和自我修正机制。 Agentic
RAG
简介: Agentic
RAG
(智能体
RAG
)将 AI Agent 的规划和推理能力与
RAG
相结合。 Graph
RAG
简介: Graph
RAG
将知识图谱技术与
RAG
相结合,通过从文档中抽取实体和关系构建知识图谱,并进行社区检测和摘要生成。 SFR
RAG
简介: SFR
RAG
(Salesforce Research
RAG
)是工业级高质量
RAG
的最佳实践。
用户1904552
2025-12-30
1.2K
0
标签:
self
架构
模型
搜索
索引
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档