news 2026/5/8 8:38:40

RAG-day2

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
RAG-day2

一、文本分块

  1. 作用:长文档不能直接喂给大模型,必须切成小块,避免超出上下文限制、检索更精准。
  2. 常见分块方式:固定大小分块、按段落分块、按语义分块。
  3. 分块原则:块不能太大(冗余多)、不能太小(语义不完整)。

二、向量化与嵌入模型

  1. 嵌入模型(Embedding 模型):专门负责把文本转成向量的模型。
  2. 特点:语义越相似的文本,转化后的向量数值越接近。
  3. 作用:是语义检索的基础,没有向量化就做不了语义匹配。

三、向量数据库

  1. 定义:专门用来存储向量、快速做相似度检索的数据库。
  2. 和普通数据库区别:普通库适合精确匹配;向量库适合语义相似度匹配
  3. 常见用途:存放文档块向量、用户问题向量,供 RAG 快速检索。

四、RAG 细化完整链路(含隐藏子步骤)

文档接入→ 文本分块→ 嵌入模型向量化→ 向量入库(存向量数据库)→ 用户提问向量化→ 向量库语义检索→ 拼接检索片段 + 用户提示词→ 大模型增强生成答案

五、语义检索核心逻辑

  1. 用户问题 → 转向量
  2. 和向量库里所有文档块向量算相似度
  3. 取出相似度最高的 Top-N 片段
  4. 作为参考资料给大模型
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/8 8:38:32

长芯微LD3424完全P2P替代AD7893,是一款快速12位模数转换器ADC

描述长芯微LD3424 是一款快速、12 位 ADC,采用 5V 单电源供电,该器件内置一个 6 微秒 (s) 逐次逼近型模数转换器、一个片内采样保持放大器、一个片内时钟和一个高速串行接口。 LD3424通过一个高速串行接口端口输出数据,这个双线串行接口具有一…

作者头像 李华
网站建设 2026/5/8 8:37:34

30块钱的矿渣板EBAZ4205,从硬件改造到SD卡启动Linux的保姆级避坑指南

30元矿渣板EBAZ4205硬核改造指南:从硬件魔改到Linux系统启动全流程解析 这块售价仅30元的EBAZ4205矿板堪称2023年嵌入式圈的"真香定律"代表。作为Xilinx Zynq-7010核心板的工业残余物,其硬件配置与千元级开发板相当——双核Cortex-A9处理器、…

作者头像 李华
网站建设 2026/5/8 8:36:35

Python移除GIL对多核性能与能耗的影响分析

1. Python GIL移除对硬件使用与能耗的影响解析在Python 3.13版本中,一个重大变革悄然发生——开发者可以通过实验性构建选项移除全局解释器锁(GIL)。这个改变可能重塑Python在多核时代的性能格局。作为长期从事高性能计算的开发者&#xff0c…

作者头像 李华
网站建设 2026/5/8 8:32:39

FPGA实现NFC读卡器:从射频电路到协议栈的硬核开发指南

1. 项目概述:当FPGA遇见NFC,一场硬核的“握手”最近在开源社区里看到一个挺有意思的项目,叫“FPGA-NFC”,作者是WangXuan95。光看这个名字,很多搞硬件的朋友可能眼睛就亮了。NFC(近场通信)大家都…

作者头像 李华
网站建设 2026/5/8 8:31:44

从模糊到清晰:Upscayl如何用AI重新定义图像超分体验

从模糊到清晰:Upscayl如何用AI重新定义图像超分体验 【免费下载链接】upscayl 🆙 Upscayl - #1 Free and Open Source AI Image Upscaler for Linux, MacOS and Windows. 项目地址: https://gitcode.com/GitHub_Trending/up/upscayl 你是否曾因一…

作者头像 李华