Dive into LLMs：手把手教你，中文系统教程让AI学习不再难！-开发者社区

在 GitHub 上看到Dive into LLMs，32,245 stars，今天又涨了 547 颗。

点进去一看：是纯中文的。

《动手学大模型 Dive into LLMs》

光听名字就知道是干嘛的：让你动手，不是光看。

要是早些时候有这个教程，我能少走一半弯路。

01 来时路

在之前

看吴恩达的课。

课是好课，但对英语不算好的同学很不友好，英语真的很重要！机翻的结果又很诡异，影响观感

看 Andrej Karpathy 的视频。

大神是大神，但人家默认你已经会 PyTorch、会微积分、会线性代数。

有点像“人再笨还能学不会微积分吗”一样，emm感觉自己又被侮辱了

门槛一高，就容易劝退。

买付费课。

我一直很支持知识付费的一个人，所以我也会花钱去请教大佬们。

但是后边却发现，都是些汉译的外网教程

可恶…又教智商税了

这次不一样。

这个教程第一节课在干嘛？

教你怎么安装 Python 环境。非常适合新手

一步一步教你：

怎么装 Anaconda、怎么创建虚拟环境、怎么装 PyTorch。

大佬手把手教你

02 本土化

本土化一致不是翻译

直到我点开跟了下这个教程，才发现它做了多少本地化工作：

代码注释是中文的

不是"这个函数计算注意力"这种奇葩机翻：

# 计算注意力分数：Q 和 K 做矩阵乘法，除以 sqrt(d_k) 防止梯度消失 scores = torch.matmul(query, key.transpose(-2, -1)) / math.sqrt(d_k)

错误提示是中文的

报错了不用复制去 Google 翻译，直接能看懂：

错误：CUDA 不可用，请检查是否安装了 GPU 版本的 PyTorch

示例数据是中文的

别小看这些细节。

英语不好的同学不用边学边翻译了，100% 的精力都可以用来理解内容。

隐形时间成本低了很多

03 它好在哪里

代码能跑，不是摆设。

很多教程的代码，你 copy 下来就跑不起来的，纯AI写的。

这个教程的代码，我 copy 的都能跑。

比如讲 Attention，它不是扔给你一堆公式，而是让你写一个函数：

def manual_attention(query, key, value, mask=None): scores = torch.matmul(query, key.transpose(-2, -1)) / math.sqrt(d_k) if mask is not None: scores = scores.masked_fill(mask == 0, -1e9) attn = torch.softmax(scores, dim=-1) output = torch.matmul(attn, value) return output, attn 输入是 (1, 10, 512)，输出也是 (1, 10, 512)。

那一刻才真正理解 Q、K、V 是干嘛的。

它解释"为什么"，告诉你何为所以然。

为什么 Attention 要除以 sqrt(d_k)？（防止梯度消失） 为什么用 LayerNorm 不用 BatchNorm？（序列长度不固定） 为什么学习率要 warmup？（前期不稳定）

理解"为什么"，你才能真正把知识转换为自己的。

它开源，免费能白嫖。

04 三步开始

第一步：Clone 项目

git clone https://github.com/Lordog/dive-into-llms.git cd dive-into-llms

第二步：装依赖

pip install -r requirements.txt

第三步：打开 Jupyter

jupyter notebook

**不要只看不练，**每段代码都亲手敲一遍

遇到不懂的地方，多跑几次，看看输入输出

学完一章，尝试自己改改代码，看看会发生什么

不用急，慢慢来，比较快

clone 下来，跑通第一个 notebook。

跑通了，你就入门了。

说真的，这两年看着身边一个个搞Java、C++、前端、数据、架构的开始卷大模型，挺唏嘘的。大家最开始都是写接口、搞Spring Boot、连数据库、配Redis，稳稳当当过日子。

结果GPT、DeepSeek火了之后，整条线上的人都开始有点慌了，大家都在想：“我是不是要学大模型，不然这饭碗还能保多久？”

我先给出最直接的答案：一定要把现有的技术和大模型结合起来，而不是抛弃你们现有技术！掌握AI能力的Java工程师比纯Java岗要吃香的多。

即使现在裁员、降薪、团队解散的比比皆是……但后续的趋势一定是AI应用落地！大模型方向才是实现职业升级、提升薪资待遇的绝佳机遇！

这绝非空谈。数据说话

2025年的最后一个月，脉脉高聘发布了《2025年度人才迁徙报告》，披露了2025年前10个月的招聘市场现状。

AI领域的人才需求呈现出极为迫切的“井喷”态势

2025年前10个月，新发AI岗位量同比增长543%，9月单月同比增幅超11倍。同时，在薪资方面，AI领域也显著领先。其中，月薪排名前20的高薪岗位平均月薪均超过6万元，而这些席位大部分被AI研发岗占据。

与此相对应，市场为AI人才支付了显著的溢价：算法工程师中，专攻AIGC方向的岗位平均薪资较普通算法工程师高出近18%；产品经理岗位中，AI方向的产品经理薪资也领先约20%。

当你意识到“技术+AI”是个人突围的最佳路径时，整个就业市场的数据也印证了同一个事实：AI大模型正成为高薪机会的最大源头。

最后

我在一线科技企业深耕十二载，见证过太多因技术卡位而跃迁的案例。那些率先拥抱 AI 的同事，早已在效率与薪资上形成代际优势，我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在大模型的学习中的很多困惑。

我整理出这套 AI 大模型突围资料包【允许白嫖】：

✅从入门到精通的全套视频教程
✅AI大模型学习路线图（0基础到项目实战仅需90天）
✅大模型书籍与技术文档PDF
✅各大厂大模型面试题目详解
✅640套AI大模型报告合集
✅大模型入门实战训练

这份完整版的大模型 AI 学习和面试资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

①从入门到精通的全套视频教程

包含提示词工程、RAG、Agent等技术点

② AI大模型学习路线图（0基础到项目实战仅需90天）

全过程AI大模型学习路线

③学习电子书籍和技术文档

市面上的大模型书籍确实太多了，这些是我精选出来的

④各大厂大模型面试题目详解

⑤640套AI大模型报告合集

⑥大模型入门实战训练

👉获取方式：
有需要的小伙伴，可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

Dive into LLMs：手把手教你，中文系统教程让AI学习不再难！

01 来时路

02 本土化

03 它好在哪里

04 三步开始

最后

①从入门到精通的全套视频教程

② AI大模型学习路线图（0基础到项目实战仅需90天）

③学习电子书籍和技术文档

④各大厂大模型面试题目详解

⑤640套AI大模型报告合集

⑥大模型入门实战训练

开源力量：OpenCore Legacy Patcher让老Mac焕发新生的完整指南 [特殊字符]

Kaggle在机器学习项目中的实战价值与工业应用

多核编程中的并发错误与字节序问题解决方案

Moltbook：LLM工具调用标准化框架，构建智能体应用的核心引擎

飞腾ARM服务器离线部署指南：用Nginx在银河麒麟V10 SP2上搭建私有yum源（附httpd对比）

Qianfan-OCR新手入门：无需代码，三步完成文档图片智能识别与问答