啥是RAG 它能干什么？

张

张建站

2026/5/15 12:47:14

10分钟阅读

RAG工作机制详解前言为什么需要学习RAG传统模型 vs. Agent前置知识补充1. Token词元2. Embedding嵌入3. 大语言模型Embedding vs. RAG Embedding为什么需要RAG实际应用场景RAG的基本运行流程回顾结语前言为什么需要学习RAGRAGRetrieval-Augmented Generation检索增强生成是一种结合了信息检索与大语言模型生成能力的技术。与传统模型相比RAG能够从外部知识库中检索相关信息再基于这些信息生成更准确、更可靠的回答。闲聊好久没写博客了现在除了原本的Chat功能现在居然也支持agent 你现在看到的开头的这段介绍都是agent自动帮我插入的编辑页面也经过了优化CSDN真是紧跟时代发展BZW最后整个排版也是 agent 自动帮我优化的我只需要自己再微调一下就可以了有点小龙虾——博客版的味道了^ _^传统模型 vs. Agent传统模型回答如何预订酒店时仅提供文字步骤。Agent直接调用预订API完成订单并返回确认信息。前置知识补充1. Token词元我们在与大模型对话时输入的是文字但在喂给大模型之前都需要先进行Token化。为什么需要Token化单词在计算机中以字符形式存储如果大模型每次都要从字符组合成单词效率太低。通过建立Token词典可以将apple转化为数字1大大提高处理效率。将字词或部分字词转化为数字的过程就叫做Tokenizer。2. Embedding嵌入如果说Tokenizer是将用户输入的文字转化为数字那么Embedding就是把这些数字转化为向量。Embedding的优势可以表示不同维度上的关系远近例如香蕉和苹果除了都是中文和水果外在其他方面区别很大而苹果对应的不同翻译如apple除了语言差异外都指同一个东西单一维度无法满足需求需要Embedding进行向量化表示3. 大语言模型Embedding vs. RAG Embedding重要区别大语言模型的Embedding主要用于理解输入文本的语义RAG的Embedding目的是概括一段话提取关键信息RAG Embedding的工作流程模型输出Embedding向量经过线性层处理将向量转化为便于理解的Token为什么需要RAG实际应用场景现在我们在学校或公司网站上总能在右下角看到一个智能管家来帮助解答问题我们当然可以在询问的时候丢给他一个系统的使用手册但是这往往就会导致很多问题如果你常用AI帮助你解决问题那么这其实是很常见的比如我们丢给豆包一片研究生论文很大概率都会出现由于文档内容太长只能读取前80% 这就是涉及到上下文窗口大小的一个问题而输入太多就会导致token的消耗很大对应的就是成本变高和速度变慢这是非常好理解的所以这个时候就需要我们RAG登场了下面对于RAG基本运行流程的分析就可以让你基本理解为什么RAG可以很好的解决这些问题RAG的基本运行流程核心步骤索引召回重排召回和重排的区别有的人就说直接在召回阶段选出前三个最相似的不就行了吗干嘛非得再次重排简直是多此一举其实关键是在于他们的筛选逻辑是不同的生成我们拿到了上面的结果之后就可以喂给大模型了我个人理解的就像是:期末考试的时候你发现你一个学期啥也没学这个时候大的来了老师最后一节课把题库或者说是考试范围和重点给你在书上圈好了你虽然铲了一学期依旧能够凭借这份资料高分通过期末考试回顾整体的流程可以分为提问前和提问后提问前的准备工作提问后结语那么RAG的有关内容就到这里了感谢你的关注 ~希望看到这里的你有美好的一天我明天还有个面试那也祝我好运吧 ~ ——5.14日晚於实验楼

医院病房管理系统E-R建模与关系转换

1. E-R 建模及从E-R图导出关系主题：某医院病房管理系统中有四个实体，如下：① 部门（Department）：Dno（部门编号）、Dname（部门名称）、Location（位置&…...

2026/5/15 12:46:53 阅读更多 →

Vaultwarden部署指南：用Rust重构Bitwarden，实现轻量级自建密码管理

1. 项目概述：从Bitwarden到Vaultwarden的演进之路如果你和我一样，是个密码管理工具的重度依赖者，那你一定听说过Bitwarden。作为一款开源的密码管理器，它凭借跨平台、免费、安全等特性，在众多商业产品中杀出了一条血路…...

2026/5/15 12:46:33 阅读更多 →

Cyber Engine Tweaks终极指南：5步掌握赛博朋克2077脚本修改框架

Cyber Engine Tweaks终极指南：5步掌握赛博朋克2077脚本修改框架【免费下载链接】CyberEngineTweaks Cyberpunk 2077 tweaks, hacks and scripting framework 项目地址: https://gitcode.com/gh_mirrors/cy/CyberEngineTweaks Cyber Engine Tweaks是一款专为…...

2026/5/15 12:46:33 阅读更多 →

【IEEE 出版 | 成都理工大学、成都信息工程大学联合主办 | 连续4年EI检索稳定、往届快至见刊后1个月EI检索 | 高届数】第五届控制工程与机器人技术国际研讨会(ISCER 2026)

第五届控制工程与机器人技术国际研讨会(ISCER 2026) 2026 5th International Symposium on Control Engineering and Robotics 2026年6月12-14日，中国成都会议官网：https://www.iscer.net【参会投稿】截稿时间：见官网主办单位&#x…...

2026/5/10 0:00:34 阅读更多 →

远程连MySQL还靠装工具？UU远程端口映射，一条规则搞定

写在前面做过开发的人，也包括我大概都有这样的经历—— 项目上线后数据库跑在公司服务器上，人在家办公时想查个数据、跑个脚本，却怎么也连不上那台远端的 MySQL。于是开始折腾 VPN、装 frp、写配置文件……一顿操作猛如虎，结果还…...

2026/5/11 15:03:32 阅读更多 →

小红书无水印下载工具终极指南：5分钟快速上手的完整教程

小红书无水印下载工具终极指南：5分钟快速上手的完整教程【免费下载链接】XHS-Downloader 小红书（XiaoHongShu、RedNote）链接提取/作品采集工具：提取账号发布、收藏、点赞、专辑作品链接；提取搜索结果作品、用户链接&a…...

2026/5/11 18:18:17 阅读更多 →

CANN/catlass TLA张量详解

TLA Tensors 【免费下载链接】catlass 本项目是CANN的算子模板库，提供NPU上高性能矩阵乘及其相关融合类算子模板样例。项目地址: https://gitcode.com/cann/catlass 本文介绍 TLA 中的 Tensor。如果说 Layout 负责描述“逻辑坐标如何映射到内存”&#xf…...

2026/5/10 0:01:56 阅读更多 →