news 2026/5/6 10:25:52

这个 GitHub 项目太炸了,RAG 知识库神器

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
这个 GitHub 项目太炸了,RAG 知识库神器

昨天又被产品经理催文档,翻了半天服务器找不到最新版本。好不容易找到个 PDF,复制粘贴出来全是乱码。拿 ChatGPT 问点技术细节,它一本正经胡说八道,还不告诉你信息从哪来的。

GitHub 上刷到个项目叫RAGFlow,看名字就知道又是搞 RAG 的。但这个有点不一样: 它会把回答的依据截图给你看。

就像以前做语文阅读理解,老师让你把答案在原文里划出来证明不是瞎编的。这下总算不用担心 AI 信口开河了。

主要功能

文档格式支持广:什么 PDF、Word、PPT、Excel 都行,连扫描版的图片文档也能识别。表格图片文字,它都能给你提取出来。

处理过程透明:别的工具你不知道它怎么处理文档的,这个可以看到文档被分成了多少段,每段内容是啥,不满意还能改。

回答有根有据:问个问题,它不光给你答案,还把相关的原文截图贴出来,甚至能直接跳到原文档的位置。这下不怕AI瞎编了。

文件类型全覆盖:除了常见的办公文档,网页、图片、数据库文件什么的都能导入。工作中碰到的文件基本都能处理。

后台自动干活:文档扔进去后,建索引、做向量化这些技术活儿都是自动的,你不用管。

多语言没问题:中文英文混在一起的文档也能处理,查的时候也不分语言。

安装指南

部署倒是挺简单,Docker 走起:

1、机器配置别太寒酸(CPU 起码4核,内存16G打底,不然跑不动)

2、代码拉下来:git clone https://github.com/infiniflow/ragflow.git

3、cd 进去找到 docker 目录,敲个命令:docker compose -f docker-compose.yml up -d

4、等个几分钟启动完,浏览器访问就行了

写在最后

老实说,经常搞文档的话这工具确实有用。特别是能看到答案出处这点,比那些黑盒工具靠谱多了。

就是硬件要求有点高,小团队可能要考虑下服务器成本。开源项目嘛,界面什么的肯定没那些收费软件做得精致。

反正我是准备在下个项目里试试,有兴趣的可以看看。

GitHub 项目地址:https://github.com/infiniflow/ragflow

好了,今天的分享到此结束,感谢大家抽空阅读,我们下期再见,Respect!

想入门 AI 大模型却找不到清晰方向?备考大厂 AI 岗还在四处搜集零散资料?别再浪费时间啦!2025 年AI 大模型全套学习资料已整理完毕,从学习路线到面试真题,从工具教程到行业报告,一站式覆盖你的所有需求,现在全部免费分享

👇👇扫码免费领取全部内容👇👇

一、学习必备:100+本大模型电子书+26 份行业报告 + 600+ 套技术PPT,帮你看透 AI 趋势

想了解大模型的行业动态、商业落地案例?大模型电子书?这份资料帮你站在 “行业高度” 学 AI

1. 100+本大模型方向电子书

2. 26 份行业研究报告:覆盖多领域实践与趋势

报告包含阿里、DeepSeek 等权威机构发布的核心内容,涵盖:

  • 职业趋势:《AI + 职业趋势报告》《中国 AI 人才粮仓模型解析》;
  • 商业落地:《生成式 AI 商业落地白皮书》《AI Agent 应用落地技术白皮书》;
  • 领域细分:《AGI 在金融领域的应用报告》《AI GC 实践案例集》;
  • 行业监测:《2024 年中国大模型季度监测报告》《2025 年中国技术市场发展趋势》。

3. 600+套技术大会 PPT:听行业大咖讲实战

PPT 整理自 2024-2025 年热门技术大会,包含百度、腾讯、字节等企业的一线实践:

  • 安全方向:《端侧大模型的安全建设》《大模型驱动安全升级(腾讯代码安全实践)》;
  • 产品与创新:《大模型产品如何创新与创收》《AI 时代的新范式:构建 AI 产品》;
  • 多模态与 Agent:《Step-Video 开源模型(视频生成进展)》《Agentic RAG 的现在与未来》;
  • 工程落地:《从原型到生产:AgentOps 加速字节 AI 应用落地》《智能代码助手 CodeFuse 的架构设计》。

二、求职必看:大厂 AI 岗面试 “弹药库”,300 + 真题 + 107 道面经直接抱走

想冲字节、腾讯、阿里、蔚来等大厂 AI 岗?这份面试资料帮你提前 “押题”,拒绝临场慌!

1. 107 道大厂面经:覆盖 Prompt、RAG、大模型应用工程师等热门岗位

面经整理自 2021-2025 年真实面试场景,包含 TPlink、字节、腾讯、蔚来、虾皮、中兴、科大讯飞、京东等企业的高频考题,每道题都附带思路解析

2. 102 道 AI 大模型真题:直击大模型核心考点

针对大模型专属考题,从概念到实践全面覆盖,帮你理清底层逻辑:

3. 97 道 LLMs 真题:聚焦大型语言模型高频问题

专门拆解 LLMs 的核心痛点与解决方案,比如让很多人头疼的 “复读机问题”:


三、路线必明: AI 大模型学习路线图,1 张图理清核心内容

刚接触 AI 大模型,不知道该从哪学起?这份「AI大模型 学习路线图」直接帮你划重点,不用再盲目摸索!

路线图涵盖 5 大核心板块,从基础到进阶层层递进:一步步带你从入门到进阶,从理论到实战。

L1阶段:启航篇丨极速破界AI新时代

L1阶段:了解大模型的基础知识,以及大模型在各个行业的应用和分析,学习理解大模型的核心原理、关键技术以及大模型应用场景。

L2阶段:攻坚篇丨RAG开发实战工坊

L2阶段:AI大模型RAG应用开发工程,主要学习RAG检索增强生成:包括Naive RAG、Advanced-RAG以及RAG性能评估,还有GraphRAG在内的多个RAG热门项目的分析。

L3阶段:跃迁篇丨Agent智能体架构设计

L3阶段:大模型Agent应用架构进阶实现,主要学习LangChain、 LIamaIndex框架,也会学习到AutoGPT、 MetaGPT等多Agent系统,打造Agent智能体。

L4阶段:精进篇丨模型微调与私有化部署

L4阶段:大模型的微调和私有化部署,更加深入的探讨Transformer架构,学习大模型的微调技术,利用DeepSpeed、Lamam Factory等工具快速进行模型微调,并通过Ollama、vLLM等推理部署框架,实现模型的快速部署。

L5阶段:专题集丨特训篇 【录播课】


四、资料领取:全套内容免费抱走,学 AI 不用再找第二份

不管你是 0 基础想入门 AI 大模型,还是有基础想冲刺大厂、了解行业趋势,这份资料都能满足你!
现在只需按照提示操作,就能免费领取:

👇👇扫码免费领取全部内容👇👇

2025 年想抓住 AI 大模型的风口?别犹豫,这份免费资料就是你的 “起跑线”!

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/3 8:53:41

构建RPM包

打包说明 原理介绍 RPM打包的时候需要编译源码,需要把编译好的配置文件、二进制命令文件等放到合适的位置,还要根据需要对RPM的包进行测试,这些都需要先有一个“工作空间”。rpmbuild命令使用一套标准化的“工作空间”: $ rpmd…

作者头像 李华
网站建设 2026/5/4 20:14:42

腾讯新闻放弃PHP,全面转向Go语言,重写代码超十万行!

最近看到一篇关于腾讯新闻团队的技术分享,讲的是他们做了一次比较大的架构调整——将底层系统从PHP全面迁移到了Go语言,重写代码超过十万行。这种规模的重构升级,确实需要不小的决心和投入。 当初为什么用PHP? 腾讯新闻早期选择…

作者头像 李华
网站建设 2026/5/3 9:43:17

衡量低代码平台 ROI(投资回报率)的几个关键指标

在数字化转型的浪潮中,低代码平台凭借 “快速搭建、降低门槛”的核心优势,成为企业加速应用落地的重要选择。但对于企业决策者而言,选择低代码平台并非单纯追求“功能多”,更核心的是评估其投资回报率(ROI)…

作者头像 李华
网站建设 2026/5/1 0:08:30

10400_基于Springboot的职业教育管理系统

1、项目包含项目源码、项目文档、数据库脚本、软件工具等资料;带你从零开始部署运行本套系统。2、项目介绍系统专门针对职业培训来设计,采用Vue框架搭建起来,MySQL数据库用来存信息,Tomcat应用服务器负责执行操作。设计并开展一个…

作者头像 李华
网站建设 2026/5/2 23:02:40

71、Subversion 命令行客户端 svn 使用指南(上)

Subversion 命令行客户端 svn 使用指南(上) 1. 引言 Subversion 是一个强大的版本控制系统,而 svn 命令行客户端则为用户提供了灵活且高效的操作方式。本文将详细介绍 svn 客户端的使用方法,包括常见选项、子命令及其操作示例。 2. 示例操作与版本查看 首先来看一个…

作者头像 李华