news 2026/4/30 13:49:39

LlamaIndex的使用

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
LlamaIndex的使用

安装 LlamaIndex

pip install llama-index

准备文档

texts = [ "《三体》是刘慈欣创作的科幻小说,讲述了地球文明与三体文明的接触和冲突。", "《红楼梦》是中国古典四大名著之一,作者一般认为是曹雪芹,描写了贾宝玉与林黛玉的爱情悲剧。", "Python 是一种高级编程语言,语法简洁,广泛用于数据分析、人工智能和 Web 开发。" ]

创建索引

fromllama_indeximportVectorStoreIndex,SimpleDirectoryReaderfromllama_index.schemaimportDocument# 将文本转换为 Document 对象documents=[Document(text=text)fortextintexts]# 创建向量索引(默认使用 OpenAI 的 embedding 模型)index=VectorStoreIndex.from_documents(documents)

VectorStoreIndex 是 LlamaIndex 中最常用的索引类型,它会将文档切片并生成向量嵌入(embeddings),便于语义搜索。

进行问答查询

# 创建查询引擎query_engine=index.as_query_engine()# 提出问题(中文)response=query_engine.query("《三体》是谁写的?")# 打印回答print(response.response)

完整代码示例

importosfromllama_indeximportVectorStoreIndexfromllama_index.schemaimportDocument# 设置 OpenAI API 密钥(可选,如果已设环境变量则无需此行)os.environ["OPENAI_API_KEY"]="你的API密钥"# 准备中文文档texts=["《三体》是刘慈欣创作的科幻小说,讲述了地球文明与三体文明的接触和冲突。","《红楼梦》是中国古典四大名著之一,作者一般认为是曹雪芹,描写了贾宝玉与林黛玉的爱情悲剧。","Python 是一种高级编程语言,语法简洁,广泛用于数据分析、人工智能和 Web 开发。"]# 转为 Document 列表documents=[Document(text=t)fortintexts]# 构建索引index=VectorStoreIndex.from_documents(documents)# 查询query_engine=index.as_query_engine()response=query_engine.query("《红楼梦》的作者是谁?")print("回答:",response.response)
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/25 3:58:00

ExplorerPatcher完整教程:Windows 11系统界面自由定制指南

ExplorerPatcher完整教程:Windows 11系统界面自由定制指南 【免费下载链接】ExplorerPatcher 提升Windows操作系统下的工作环境 项目地址: https://gitcode.com/GitHub_Trending/ex/ExplorerPatcher 还在为Windows 11的界面改变感到不适吗?Explor…

作者头像 李华
网站建设 2026/4/25 8:48:24

2025 网安工程师证报考攻略:80 学时培训要求 + 两科必过 + 单独划线地区政策,一文说透!

网络信息安全工程师是一种专门从事网络安全工作的职业。随着互联网的快速发展和普及,网络安全问题也日益突出,因此网络信息安全工程师的需求也越来越大。 网络信息安全工程师主要负责保护网络系统和数据的安全,防止黑客攻击、病毒侵入、数据泄…

作者头像 李华
网站建设 2026/4/23 23:13:44

3分钟搞定B站缓存转换:m4s转MP4完整教程

还在为B站缓存的视频无法在其他设备播放而烦恼吗?m4s-converter正是你需要的解决方案!这款专业的视频格式转换工具能够快速将B站的m4s缓存文件转换为通用的MP4格式,让你随时随地欣赏喜爱的视频内容。😊 【免费下载链接】m4s-conve…

作者头像 李华
网站建设 2026/4/25 6:54:27

Google Patents Public Data实战指南:5步掌握专利大数据分析核心技术

想要快速掌握专利数据分析的核心技能吗?Google Patents Public Data项目为您提供了完整的解决方案。这个基于BigQuery的专利分析平台整合了全球多个权威机构的专利数据,让您能够轻松进行技术趋势分析、竞争对手监测和市场机会发现。 【免费下载链接】pat…

作者头像 李华
网站建设 2026/4/25 9:48:42

【高级模型诊断技术】:深入理解R中随机森林残差与变量重要性图

第一章:R语言随机森林模型诊断概述随机森林是一种基于集成学习的分类与回归方法,因其高准确性、抗过拟合能力以及对特征重要性的内在评估而广泛应用于各类数据分析任务。在R语言中,randomForest包为构建和诊断随机森林模型提供了完整支持。模…

作者头像 李华