本文来自《AI实战90讲》——90个实战项目,跑出你的AI竞争力。
一、专栏简介
欢迎来到《AI实战90讲:从入门到项目落地(2026版)》!
这是一个「动手第一、理论辅助」的 AI 实战专栏。不讲空洞的公式推导,不讲你一辈子用不到的边缘理论——每一个项目都是一份完整、可运行、能写进简历的代码。
你可能会问:网上免费教程那么多,为什么要付费订阅?
三个理由:
90 个项目形成体系。免费教程最大的问题是碎片化——今天看一篇图像分类,明天看一篇 NLP,后天不知道学什么。本专栏按照「4 周 × 30 天」的节奏编排,从 CV 到 NLP 到多模态到工程部署,形成完整闭环。跟着走,你不会迷路。
每个项目都能跑通。我见过太多教程贴一段不完整的代码,缺 import、缺数据、跑不通。本专栏每个项目都经过本地验证——
python code_XX.py必须 exit 0。网络下载失败有本地降级数据,GPU 不可用有 CPU 模式,你拿到手的代码就是能跑的。不只是代码,还有「为什么」。每个核心技术点后面都跟着至少一段「为什么这样设计」的解读。理解设计决策比记住 API 调用重要十倍——面试官问的不是「你用过 YOLO 吗」,而是「为什么 YOLO 比 Faster R-CNN 快」。
⚡ 关于价格:越早订阅,越划算
这个专栏采用 CSDN 常见的阶梯定价策略:内容越多,价格越高。
- 每天更新 3-8 篇,一个月内完成全部 90 个项目
- 当前专栏还在持续更新中,价格处于早鸟低价区间
- 随着项目数量从 20 篇 → 50 篇 → 90 篇,价格会逐步上调
- 现在订阅 = 锁定当前低价 + 永久享受后续 80+ 篇更新
一句话:早到早享受,早到早优惠。等到 90 篇全部更新完再订阅,价格可能已经涨了几轮。而且你现在订阅,每篇新文章发布时你会第一时间收到通知——学习节奏完全由你掌控。
订阅后你获得的不只是 90 篇静态文章,而是一条每天更新的 AI 技能成长线。今天先跑通图像分类,明天攻克目标检测,后天拿下 NLP……每天一小时,一个月后你简历上的项目经验一栏,写都写不下。
AI 时代,为什么还要「手搓」代码?
你可能还有一个疑问:现在 ChatGPT、Claude、Copilot 都能一键生成代码了,为什么还要订阅专栏一行行学?
因为 AI 替你写代码 ≠ 你不需要懂代码。我面试过几十个候选人,一个明显的趋势是:过度依赖 AI 的开发者,遇到问题时的排查能力急剧下降。AI 生成的代码跑不通怎么办?AI 给出了错误方案怎么办?AI 不理解你的业务场景怎么办?这些问题 AI 不会替你回答——只有真正理解每一行代码的人才能解决。
这个专栏刻意让你「手搓」——从 import 开始,到模型定义、训练循环、推理管道,每一步都自己写一遍。
为什么这样设计?
AI 能写代码,但不能替你 debug。代码跑不通时,你需要知道是数据问题还是模型问题、是版本兼容还是逻辑错误。这种排查能力只有亲手写过、亲手踩过坑才能获得。
AI 能生成方案,但不能替你决策。为什么这里用 Adam 而不是 SGD?为什么 learning rate 是 0.001 而不是 0.01?为什么用 LANCZOS 而不是 NEAREST?AI 可以给你答案,但判断答案对不对的是你。
AI 能回答问题,但不能替你面试。面试官会让你在白板上写 forward 函数、解释 attention 机制的维度变换、手推反向传播——这些能力必须靠亲手实现来内化。
AI 让你入门快,但让你走不远。初学者用 AI 写代码,10 分钟跑通一个项目,成就感很高——但三个月后还是只会调 API。亲手写过一遍的人,三个月后能独立设计架构。
这个专栏的价值不是「给你代码」(AI 也能给),而是「让你成为那个真正懂代码的人」。90 个项目做完,你会发现:不是学会了用某个框架,而是掌握了能迁移到任何框架的底层能力。
你将获得
| 维度 | 内容 |
|---|---|
| 技能栈 | 图像分类、目标检测、图像分割、图像生成、NLP、RAG、Agent、时间序列、语音、多模态、推荐系统、数据工程、模型部署 |
| 框架覆盖 | PyTorch、Ultralytics、Transformers、Diffusers、LangChain、FastAPI、Docker |
| 代码量 | 90 个完整可运行 Python 项目,总计 10000+ 行,每行都有注释 |
| 工程能力 | 模型部署、容器化、API 优化、Prompt 工程、模型量化 |
| 项目经验 | 可直接写入简历的完整项目经历 |
适合谁
- 有 Python 基础,想转行 AI 的开发者:90 天系统入门,跳过碎片化学习
- 在校学生:毕业设计、找实习、丰富简历的绝佳素材
- 已经在做 AI,想拓宽技能面的工程师:从 CV 扩展到 NLP、多模态、工程部署
- 技术管理者:快速了解 AI 各方向的能力边界,便于技术选型
不适合谁
- 完全零编程基础(建议先学 Python 基础)
- 想深入研究数学推导的(本专栏聚焦实战,理论 < 20%)
每个项目代码内已注明公开数据集来源和下载链接,按需自行获取即可。
二、学习路线图
第1周(01-21):图像与视觉 图像分类 → 目标检测 → 图像分割 → 图像生成 → 人脸应用 掌握:PyTorch、YOLOv8、UNet、Stable Diffusion 第2周(22-42):文本与NLP 文本分类 → 情感分析 → 文本生成 → RAG → Agent 掌握:LLM API、LangChain、向量数据库、Function Calling 第3周(43-63):多领域实战 时间序列 → 语音 → 多模态 → 推荐系统 → 数据分析 → 工具开发 掌握:LSTM、Whisper、CLIP、协同过滤、数据处理 第4周(64-90):工程化与综合应用 Web部署 → 容器化 → 性能优化 → 行业案例 → 面试准备 掌握:FastAPI、Docker、Prompt工程、模型量化、生产级部署三、数据集来源说明
本专栏所有数据集来源分为三类:
- Kaggle / 公开数据集:大部分 CV 和 NLP 项目使用,免费注册即可下载
- HuggingFace Datasets:通过
datasets库一行代码加载,无需手动下载 - Python 自动生成:部分项目内置演示数据生成逻辑,零下载成本直接运行
每个项目代码中已注明公开数据集来源(Kaggle、HuggingFace 等),请自行下载。代码内置了本地演示数据降级方案,即使不下载数据集也能跑通。
四、90 个项目完整目录
第1周:入门与图像方向(项目01-21)
| 编号 | 项目名称 | 数据集来源 |
|---|---|---|
| 01 | AI实战90讲 & 专栏目录 | - |
| 02 | 5行代码跑通第一个AI项目 | torchvision内置 |
| 03 | ResNet猫狗识别 | Kaggle Dogs vs Cats |
| 04 | VGG16花卉识别 | Kaggle Flowers |
| 05 | MobileNet垃圾分类 | TrashNet |
| 06 | EfficientNet菜品识别 | Food-101 |
| 07 | YOLOv8行人检测 | COCO 2017 |
| 08 | YOLOv8车牌识别 | CCPD |
| 09 | YOLOv8口罩检测 | Mask Wearing |
| 10 | UNet医学分割 | DRIVE |
| 11 | SAM一键抠图 | 自选图片 |
| 12 | 文档扫描矫正 | 自拍文档 |
| 13 | SD文生图 | 提示词自拟 |
| 14 | SD风格转换 | 自选图片 |
| 15 | ControlNet线稿上色 | 线稿图片 |
| 16 | LoRA头像风格 | 自拍头像 |
| 17 | 人脸融合 | 自选人脸 |
| 18 | 图片超分辨率增强 | 低分辨率图 |
| 19 | 人脸识别考勤 | LFW |
| 20 | 表情识别情绪分析 | FER2013 |
| 21 | 年龄性别预测 | UTKFace |
第2周:文本与NLP方向(项目22-42)
| 编号 | 项目名称 | 数据集来源 |
|---|---|---|
| 22 | LLM新闻分类 | AG News |
| 23 | LLM垃圾短信识别 | SMS Spam |
| 24 | LLM多标签分类 | Reuters |
| 25 | LLM评论情感分析 | 电商评论 |
| 26 | LLM实体提取 | 自拟文本 |
| 27 | LLM关键词摘要 | 新闻文本 |
| 28 | LLM文章续写 | 自拟开头 |
| 29 | LLM文案生成 | 商品描述 |
| 30 | LLM多语言翻译 | Tatoeba |
| 31 | RAG PDF文档问答 | 自选PDF |
| 32 | RAG网页内容问答 | 网页URL |
| 33 | RAG知识库搜索 | 本地文档 |
| 34 | RAG+重排序精准问答 | 多文档集 |
| 35 | 多轮对话智能客服 | 模拟对话 |
| 36 | 混合检索文件搜索 | 本地文件 |
| 37 | Function Calling天气查询 | 模拟天气API |
| 38 | Agent自动信息搜集 | 模拟搜索 |
| 39 | 多工具Agent数据分析 | 模拟CSV |
| 40 | Agent自动邮件撰写 | 模拟邮件 |
| 41 | 多Agent报告生成 | 模拟课题 |
| 42 | 记忆系统AI管家 | 模拟偏好 |
第3周:时序与多模态方向(项目43-63)
| 编号 | 项目名称 | 数据集来源 |
|---|---|---|
| 43 | LSTM股票价格预测 | Yahoo Finance |
| 44 | Transformer电力负荷预测 | UCI电力 |
| 45 | Prophet销售额预测 | 模拟生成 |
| 46 | LSTM+Attention天气预测 | 气象数据 |
| 47 | 时序异常故障预警 | NAB |
| 48 | 多变量LSTM交通预测 | PeMS |
| 49 | Whisper语音转文字 | 自录音频 |
| 50 | CosyVoice文字转语音 | 自拟文本 |
| 51 | 智能会议记录 | 会议录音 |
| 52 | VLM图片内容描述 | COCO |
| 53 | VLM图片问答 | 自选图片 |
| 54 | CLIP以图搜图 | Unsplash |
| 55 | 协同过滤电影推荐 | MovieLens |
| 56 | 矩阵分解商品推荐 | 模拟数据 |
| 57 | LLM个性化内容推荐 | 模拟文章 |
| 58 | NL2SQL自然语言查数据库 | SQLite示例 |
| 59 | LLM自动数据可视化 | 销售数据 |
| 60 | AI智能报表生成 | 模拟业务数据 |
| 61 | 图片批量去水印 | 自选图片 |
| 62 | 视频自动字幕 | 测试视频 |
| 63 | PDF转Markdown | 测试PDF |
第4周:综合项目(项目64-90)
| 编号 | 项目名称 | 主要技术 |
|---|---|---|
| 64 | AI图片生成网站(Flask+SD) | flask + diffusers |
| 65 | AI对话机器人(Gradio) | gradio |
| 66 | RAG问答系统(Streamlit) | streamlit + langchain |
| 67 | AI简历筛选工具 | langchain + LLM |
| 68 | AI面试模拟系统 | LLM |
| 69 | AI学习计划生成器 | LLM |
| 70 | AI图片批量处理工具 | PIL + opencv |
| 71 | AI文章批量生成工具 | LLM |
| 72 | AI数据清洗工具 | pandas + LLM |
| 73 | AI自动周报生成 | LLM |
| 74 | AI自动日报生成 | LLM |
| 75 | AI自动会议纪要 | whisper + LLM |
| 76 | FastAPI部署AI模型 | fastapi |
| 77 | Docker容器化AI应用 | docker |
| 78 | Docker Compose部署RAG | docker + langchain |
| 79 | LLM API调用优化 | openai |
| 80 | Prompt优化实战 | LLM |
| 81 | 模型量化与加速 | torch |
| 82 | AI+教育自动出题批改 | LLM |
| 83 | AI+医疗症状分析建议 | LLM |
| 84 | AI+电商商品描述生成 | LLM |
| 85 | AI+金融股市影响分析 | LLM + yfinance |
| 86 | AI+法律合同条款提取 | LLM |
| 87 | AI+自媒体视频文案生成 | LLM |
| 88 | 环境依赖打包指南 | - |
| 89 | 常见报错与解决方法 | - |
| 90 | 专栏总结与学习路线图 | - |
五、环境准备(5分钟搞定)
本专栏使用 Python 3.10+,建议用 conda 创建独立环境,避免包冲突:
# 1. 安装 Anaconda(如已安装跳过)# 下载:https://www.anaconda.com/download# 2. 创建专栏专用环境conda create-nai90python=3.10conda activate ai90# 3. 安装 PyTorch# CPU版本(所有电脑都能跑):pipinstalltorch torchvision torchaudio# NVIDIA GPU版本(训练速度快5-10倍):# pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118# 4. 后续每个项目需要的额外包,代码开头注释里都有# 例如项目07需要:pip install ultralytics pillow国内用户加速:下载慢时加上清华镜像
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple 包名
每个项目的完整依赖清单见【项目88】《专栏项目依赖环境打包指南》。
六、读者最爱 Top 10
根据专栏完读率和读者反馈,这 10 个项目最受欢迎:
| 排名 | 编号 | 项目 | 为什么受欢迎 |
|---|---|---|---|
| 1 | 07 | YOLOv8行人检测 | 3行代码跑通目标检测,即学即用 |
| 2 | 31 | RAG PDF文档问答 | RAG是2025最热门的LLM应用架构 |
| 3 | 43 | LSTM股票预测 | 量化交易入门首选,数据易获取 |
| 4 | 03 | ResNet猫狗识别 | 迁移学习经典案例,面试高频题 |
| 5 | 13 | Stable Diffusion文生图 | 生成式AI最直观的体验入口 |
| 6 | 57 | LLM个性化推荐 | 冷启动问题的优雅LLM解决方案 |
| 7 | 69 | AI学习计划生成器 | 每个人都能立刻用上的工具 |
| 8 | 76 | FastAPI部署AI模型 | 从训练到API的完整闭环 |
| 9 | 50 | CosyVoice文字转语音 | 语音合成效果惊艳,中文支持好 |
| 10 | 25 | LLM情感分析 | 反讽识别能力远超传统方法 |
如果你是第一次接触本专栏,从 Top 5 中任选一篇开始,感受一下「代码即文章」的体验。
七、使用建议
如果你是初学者:严格按编号顺序学习。01-21 打好 CV 基础 → 22-42 攻克 NLP → 43-63 拓展多领域 → 64-90 冲刺工程能力。
如果你有基础:直接跳到感兴趣的项目。每个项目完全独立,不依赖前面的代码。目录上方标注了领域分类,方便快速定位。
如果你在准备面试:重点做 03(迁移学习)、07-09(YOLO 全系列)、31-36(RAG 全系列)、43-48(时序预测)、76-78(部署全系列)。这些是面试中最常被问到的实战方向。
遇到问题怎么办:
- 先查看【项目89】《常见报错与解决方法大全》
- 检查 Python 版本和依赖版本是否匹配
- 在对应文章评论区留言,我会回复每一条
90 个项目,90 天,一份能写进简历的 AI 项目经验。
今天从项目02开始,5行代码跑通你的第一个AI模型。
订阅后记得收藏本文作为导航页,每个项目做完回来打个勾——90 个勾打完,你就成了一个能独立交付 AI 项目的工程师。
有问题欢迎评论区交流,我会回复每一条留言。