Jina AI “Late-Chunking“如何解决RAG的文档分块困境-开发者社区

摘要

文档分块（Chunking）是构建检索增强生成（RAG）系统中最基础、也最棘手的一环。长久以来，开发者们一直在“小分块（有利于检索精度）”和“大分块（有利于上下文完整性）”这对根本矛盾中艰难权衡。传统的固定大小、递归字符、甚至语义分块策略，都只是在这一矛盾体上寻找妥协点，未能从根本上解决问题。今天一起看下Jina AI提出的开源项目late-chunking，它通过将检索单元与生成单元解耦，实现了在检索时精准、在生成时完整的双重目标。

1. RAG的核心问题：无法调和的分块困境

构建任何RAG系统的第一步都是将原始文档切分成小块（Chunks），以便进行向量化和索引。然而，这个看似简单的操作，却隐藏着一个深刻且难以调和的内在矛盾：分块粒度。

小分块 (Small Chunks)：例如，单个句子或短段落。
- 优点: 语义单一、高度聚焦，使得向量表示更具区分度，在检索阶段能够实现更高的匹配精度（Precision）。
- 缺点: 严重缺乏上下文。如果只将一个小分块提供给LLM，它可能无法理解其背景、前提和

Part 02｜我为什么开始自己做一套商城系统

在对现成商城系统产生怀疑之后，我并没有立刻下定决心要“自己做一套”。真正把这件事推到台前的，其实是一个很现实的触发点： 客户开始明确地询问商城系统相关的需求。一、问题不是“要不要做”，而是“拿什么交付” 当客户问到商城…

李华

38、Python编程：回调函数、包管理与系统操作全解析

Python编程：回调函数、包管理与系统操作全解析 1. 回调函数基础回调函数和传递函数的概念对于一些人来说可能比较陌生，但深入了解它是很有价值的。在Python中，函数是“一等公民”，这意味着可以像操作对象一样传递和处理函数。 1.1 函数作为一等公民示例 In [1]: def …

李华

39_Spring AI 干货笔记之 Ollama 嵌入

一、Ollama 嵌入使用 Ollama，您可以在本地运行各种 AI 模型并从中生成嵌入。嵌入是一个浮点数向量（列表）。两个向量之间的距离衡量它们的相关性。距离小表示相关性高，距离大表示相关性低。 OllamaEmbeddingModel 实现利用了 O…

李华

终极指南：解锁Quansheng对讲机隐藏功能的完整方案

终极指南：解锁Quansheng对讲机隐藏功能的完整方案【免费下载链接】uv-k5-firmware-custom This is a fork of Egzumer https://github.com/egzumer/uv-k5-firmware-custom 项目地址: https://gitcode.com/gh_mirrors/uvk/uv-k5-firmware-custom 还在为对讲机…

李华

AI大模型之Agent,RAG,LangChain(二)

这一期我来详细分析一下RAG的基础理论知识.RAG作为LLM重要的一种思想,在工作中的应用是相当广泛的.一.为什么使用RAG1.传统LLM在传统LLM中,有四个重要的缺陷有待解决.LLM的数据不是实时的.在这里我举个例子,比如说,不使用LLM工具,直接询问当下热点事件,大模型会回答你他不知道,…

李华

CLI形态的智能编程

CLI形态的智能编程，是指把AI编程能力做成“命令行工具（Command-Line Interface）”，让开发者在终端里直接敲自然语言指令，就能完成写代码、改Bug、跑测试、部署等任务，而不必打开图形界面或IDE。它的核心特点…

李华