2026年学大模型，别乱读书！这13本“硬核书单”就是你的高效知识地图，啃完体系自成-开发者社区

想自学大模型，但是大模型的书这么多，该怎么选呢？

这里给大家推荐基本大模型入门必看的书籍，看完这13本书，让你从零基础小白到精通

大模型基础

大模型入门不可错过的一本书，就是这本大模型界的经典畅销书《大规模语言模型》！系统性强，内容适合初学者，如果你想知道如何构建一个大模型应用，系统了解大模型的构建，选它准没错！

**▊《**大规模语言模型：从理论到实践》

张奇，桂韬，郑锐，黄萱菁著

解码大语言模型奥秘，引领机器智能新时代
详细介绍构建LLM的四个主要阶段：预训练、有监督微调、奖励建模和强化学习
解读ChatGPT背后的核心技术
配全书PPT课件

为了使更多的自然语言处理研究人员和对大语言模型感兴趣的读者能够快速了解大模型的理论基础，并开展大模型实践，复旦大学张奇教授团队结合他们在自然语言处理领域的研究经验，以及分布式系统和并行计算的教学经验，在大模型实践和理论研究的过程中，历时8个月完成本书的撰写。希望这本书能够帮助读者快速入门大模型的研究和应用，并解决相关技术问题。

本书详细介绍了构建大语言模型的四个主要阶段：预训练、有监督微调、奖励建模和强化学习。每个阶段都有算法、代码、数据、难点及实践经验的详细讨论。

本书以大语言模型的基础理论开篇，探讨了大语言模型预训练数据的构建方法，以及大语言模型如何理解并服从人类指令，介绍了大语言模型的应用和评估方法，为读者提供了更全面的视野。

本书旨在为对大语言模型感兴趣的读者提供入门指南，也可作为高年级本科生和研究生自然语言处理相关课程的补充教材！

《大语言模型》，作者来自一线的产业界，书中有工程实践，代码配套齐全，如果你想了解更多产业实践方面的内容，就选它！

**▊《**大语言模型：原理与工程实践》

杨青编著

揭开LLM的神秘面纱，解读其机理和工程实践，手把手教你训练7B LLM

本书用10 章对大语言模型进行全面且深入的介绍。首先对大语言模型的基本概念进行介绍。其次，从大语言模型的基础技术、预训练数据构建、预训练技术等方面展开讨论，帮助读者深入了解大语言模型的构建和训练过程。然后，详细介绍有监督微调和强化对齐等技术，以及如何评估大语言模型的性能。外，介绍提示工程和工程实践等方面的内容，帮助读者了解大语言模型的应用和实际操作过程。最后，介绍如何从零开始微调大语言模型，辅以代码示例，帮助读者更好地应用这些技术。

通过阅读本书，读者可以获得全面且深入的大语言模型的知识框架。无论您是研究人员、工程师，还是产品经理，都能从中获得有价值的知识。

《解构大语言模型》，从模型发展史的角度，带你在技术层面上了解大模型是如何从最简单的线性回归模型发展为如今的大语言模型的，精细解读了模型架构与代码实现，有助于打好基本功，对大模型有更深的理解和认识！

▊**《解构大语言模型：从线性回归到通用人工智能（全彩）》**

唐亘著

从模型结构和数据基础两大角度解构大语言模型
详解经典模型的核心结构及实现过程，夯实基础
模型开发与调优，重构ChatGPT，GitHub配套代码
融合统计分析/机器学习/经济学等知识，全彩印刷

本书从模型的结构和数据基础两个方面解构大语言模型，以便帮助读者理解和搭建类似ChatGPT的系统。在模型的结构方面，大语言模型属于深度神经网络，其设计核心是注意力机制，因此，本书涵盖了多层感知器、卷积神经网络和循环神经网络等经典模型。在模型的数据基础方面，本书既涉及模型训练的工程基础，如反向传播，又涉及数据的使用方式，如迁移学习、强化学习，以及传统的监督学习和无监督学习。此外，本书还阐述了如何从计量经济学和经典机器学习模型中汲取灵感，以提高模型的稳定性和可解释性。

本书既适用于希望深入了解大语言模型、通过人工智能技术解决实际问题的读者，也适合作为高等院校计算机及相关专业的师生参考用书。

《大语言模型应用指南》，这本书更侧重于对大模型的使用，从如何使用ChatGPT到如何基于大模型进行二次开发、创建GPTs、Agent系统分析等，由浅入深，带你了解大模型应用的一切！小白读者也可以读懂~~

一直在更新，更多的大模型学习和面试资料已经上传带到CSDN的官方了，有需要的朋友可以扫描下方二维码免费领取【保证100%免费】👇👇

**▊《**大语言模型应用指南：以ChatGPT为起点，从入门到精通的AI实践教程（全彩）》

万俊著

大语言模型的应用与二次开发
探索智能前沿，驾驭模型力量，对人工智能或编程技术小白读者友好
技术点包含提示工程、长短期记忆、GPTs、Agent系统、微调与安全技术、GPT-4V与Gemini、尺度定律与压缩即智能等

本书是一本对人工智能小白读者非常友好的大语言模型应用指南，有两大特点：一是以通俗易懂的方式解释复杂概念，通过实例和案例讲解大语言模型的工作原理和工作流程、基本使用方法，包括大语言模型常用的三种交互格式、提示工程、工作记忆与长短期记忆，以及外部工具等，使读者能够全面了解和掌握这一先进技术的应用和二次开发；二是紧跟当前大语言模型技术的更新动态，介绍GPTs的创建，以GPT-4V和Gemini为例讲述多模态模型的应用，还包括无梯度优化、自主Agent系统、大语言模型微调、RAG框架微调、大语言模型安全技术等。

无论是学术研究者、工程师，还是对大语言模型感兴趣的普通读者，都可以通过本书获得大语言模型的前沿研究成果、技术进展和应用案例，从而更好地应用大语言模型解决实际问题。

多模态大模型

了解了以上大模型的基础内容，再来看看如今已经实现了文本-图像-语音-视频“大统一”的多模态大模型！

两本《多模态大模型》，该怎么选呢？

想要系统全面地了解多模态大模型的技术理论知识及应用，就选这本**《多模态大模型：新一代人工智能技术范式》**。

▊《多模态大模型：新一代人工智能技术范式（全彩）》

刘阳林倞著

多模态大模型基础、核心、模型详细剖析
AIGC、具身智能、视觉问答等典型应用案例，
因果推理、世界模型、Sora、AGI Agent等前沿技术探究

本书以深入浅出的方式介绍多模态大模型的技术方法、开源平台和应用场景，并详细阐述因果推理、世界模型及多智能体与具身智能等前沿技术领域，有助于读者全面了解多模态大模型的特点及发展方向，对新一代人工智能技术范式和通用人工智能的发展起到重要推动作用。

本书内容共5章，第1章引领读者深入探索最具代表性的大模型结构，包括BERT、Chat-GPT 和ChatGLM等，为建立对多模态大模型的全面认知打下基础。第2章深度剖析多模态大模型的核心技术，如提示学习、上下文学习、思维链和人类反馈强化学习等，揭示多模态大模型的独特之处和引人入胜的技术内涵。第3章介绍多个具有代表性的多模态基础模型，如CLIP、LLaMA、SAM和PaLM-E等，为读者呈现多样和广泛的技术解决方案。第4章深入分析视觉问答、AIGC和具身智能这三个典型应用，展示多模态大模型在实际场景中的强大能力。第5章探讨实现AGI的可行思路，包括因果推理、世界模型、超级智能体与具身智能等前沿技术方向。

本书不仅适合高校相关专业高年级本科生和研究生作为教材使用，更是各类IT从业者的必备参考之作。

想要从模型的发展脉络及实践的角度了解的话，就选这本**《多模态大模型：技术原理与实战》**。

**▊《**多模态大模型：技术原理与实战》

彭勇，彭旋，郑志军，茹炳晟著

读懂ChatGPT的核心技术、GPT的进化史和创新点
详述多模态大模型的核心技术和应用场景
让中小公司可以从0到1部署多模态大模型，打开通往通用人工智能的大门

本书详细介绍了大语言模型和多模态大模型的发展历史、技术原理和亮点、主要的开源框架、配套工具、部署细则和实战案例。为了让读者更好地进行大模型的应用实战，本书还详细介绍了使用大模型为商业赋能的3个应用案例。期望本书能够帮助读者打开通往大模型尤其是多模态大模型的学习、实战和商业成功之路。

扩散模型

想要了解各种AI生成背后的秘密，就看看这本**《扩散模型》**吧~~

**▊《**扩散模型：生成式AI模型的理论、应用与代码实践》

杨灵，张至隆，张文涛，崔斌著

本书作者团队来自著名学府，且与国际知名研究机构、院校有众多交流，其提供的内容具有权威性，并获得众多专家、学者认可
本书从理论和实践两个方面进行了细致介绍。阅读本书的读者，即可获得学术收益，又可进行实践应用
为方便进行理论实践，本书提供了可配套运行的代码文件，读者可以进行下载

本书深入浅出地介绍了扩散模型的知识，案例丰富，讲解细致。第1章介绍AIGC与相关技术，第2章从三个视角介绍扩散模型的基本理论、算法，此外介绍了扩散模型的神经网络架构和代码实现。第3章、第4章、第5章分别从高效采样、似然优化、数据结构三个方面系统介绍了扩散模型的特点，以及后续的改进工作。第6章讨论了扩散模型与其他生成模型的关联，包括变分自编码器、生成对抗网络、归一化流、自回归模型和基于能量的模型。第7章介绍了扩散模型的应用，包括计算机视觉、自然语言处理、时间数据建模、多模态学习、鲁棒学习和跨学科应用。第8章讨论了扩散模型的未来，以及与GPT和大模型的关联。

本书适合高等院校计算机科学、人工智能和医学、生物学等交叉学科专业的师生，以及相关人工智能应用程序的开发人员阅读。

大模型压缩

而如果你意识到，随着大模型规模的增长，模型的算力与可用资源之间的矛盾也在日益加剧，那就一定要读一读这本**《高效深度学习：模型压缩与设计》**，看看如何降低大模型应用成本！

**▊《**高效深度学习：模型压缩与设计（全彩）》

汪玉宁雪妃著

高效模型压缩与设计，释放大模型潜能，赋能千行百业
清华大学电子工程系汪玉宁雪妃作品
权威：出自芯片领域著名专家之手
系统：系统梳理模型压缩与设计关键技术
经验：提供实践中总结的分析思路和经验

本书系统地介绍了高效模型压缩和模型设计的方法，在编写上兼顾理论和实践。本书主体部分详细介绍了模型压缩的方法论，包括高效模块设计、模型剪枝、模型量化、模型二值化、神经网络架构搜索、知识蒸馏几大部分。另外，简要介绍了定制化硬件加速器的设计及大语言模型的加速和压缩。

开源大模型

想要从大模型中挑一个具体研究？Llama是个不错的选择！可以看看这本**《Llama大模型实践指南》**。

▊《Llama大模型实践指南》

张俊祺，曲东奇，张正，占冰强等著

全面介绍Llama的入门指南；实用案例和示例代码助你快速上手；本书配套AI助手答疑解惑

本书共包括7章，涵盖了从基础理论到实际应用的全方位内容。第1章深入探讨了大模型的基础理论。第2章和第3章专注于Llama 2大模型的部署和微调，提供了一系列实用的代码示例、案例分析和最佳实践。第4章介绍了多轮对话难题，这是许多大模型开发者和研究人员面临的一大挑战。第5章探讨了如何基于Llama 2定制行业大模型，以满足特定业务需求。第6章介绍了如何利用Llama 2和LangChain构建高效的文档问答模型。第7章展示了多语言大模型的技术细节和应用场景。本书既适合刚入门的学生和研究人员阅读，也适合有多年研究经验的专家和工程师阅读。

通过阅读本书，读者不仅能掌握Llama 2大模型的核心概念和技术，还能学会如何将这些知识应用于实际问题，从而在这一快速发展的领域中取得优势。