news 2026/4/15 15:24:01

[特殊字符]爆肝总结!吴恩达AI课揭秘:大模型不是神仙!这5大局限性不知道,你的AI项目可能要翻车!

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
[特殊字符]爆肝总结!吴恩达AI课揭秘:大模型不是神仙!这5大局限性不知道,你的AI项目可能要翻车!

吴恩达2023年11月推出的面向普通人的AI入门级教程 Generative AI for everyone的第八节:AI能做什么和不能做什么以及AI的局限(What LLMs can and cannot do)。以下相关文字内容和双语字幕视频(文末):

『 生成式 AI 是一项了不起的技术,但它并非万能。

在本视频中,我们将仔细研究 LLM 能做什么和不能做什么。我们将从我常用的、对LLM能做什么的思维模型(将LLM假设成一个刚毕业的大学生)开始。之后,我们一起来看看 LLM 的一些具体局限性。理解这些局限性可以降低你因试图将它们用于不擅长的任务而受挫的可能性。那么,让我们开始吧。

一、LLM能做什么?一个有用的思维框架

如果你想弄清楚提示 LLM 能做什么,我有一个有用的思维框架:我会问自己,一个刚毕业的大学生,仅按照提示词(prompt),能否完成你想要的任务?

例如,一个刚毕业的大学生能否按照指示阅读电子邮件,以确定该邮件是否为投诉?我认为一个刚毕业的大学生能做到,而且能做得很好。或者,一个刚毕业的大学生能否阅读对餐厅的评论来判断它是客户的积极情绪还是消极情绪?我想他们也能做得很好。用提示词(prompt)要求 LLM 完成任务也是如此。

这里有另外的一个例子:一个刚毕业的大学生是否可以在没有任何你公司运营信息的情况下撰写关于公司的新闻稿?嗯,这个刚毕业的大学生才刚毕业,他们才刚认识你,对你的业务一无所知。所以他们能做的最好的事情可能就是写一篇非常普通且不太令人满意的新闻稿。

但另一方面,如果你向他提供更多关于你的业务和运营的背景信息,那么我们现在可以问,鉴于基本的背景信息,这个刚毕业的大学生能否撰写新闻稿?我认为他们或许能够做得相当好,大型语言模型也是如此。

可以将LLM简单类比为一个刚毕业的大学生。将这个“刚毕业的大学生”想象成拥有大量的背景知识,了解很多互联网上的常识,但必须在无法访问网络搜索引擎的情况下完成这项任务,并且“他”对你或你的业务一无所知。为了简单清楚起见,这个思维模型就是想象一个刚毕业的大学生在没有任何培训的情况下完成任务。

每次你新开一个对话窗口,用提示词给LLM下指令,LLM 实际上并不记得之前的对话。所以就好像你为每个任务都找到了一个不同的刚毕业的大学生。因此,你无法随着时间的推移,针对你的业务细节或你希望的写作风格来训练他们。

询问刚毕业的大学生能做什么的这条经验法则并不完美。有些事情大学毕业生可以做,而其他人做不到,反之亦然。但这是思考LLM能做什么和不能做什么的一个有用的起点。

虽然我们这节课将专注于此幻灯片上提示的 LLM 可以做什么,但下周当我们谈论生成式 AI 项目时,我们将讨论一些稍微强大的技术,这些技术可能会扩展你使用生成式 AI 可以做的事情,超出这个刚毕业的大学生的概念。

二、LLM的局限性

现在,让我们看看 LLM 的一些更具体的局限性。

1.首先是知识截止日期。LLM 对世界的了解在训练时就被冻结了。更准确地说,在 2022 年 1 月之前在互联网数据上训练的模型将没有关于2022 年 1 月之后的任何信息。因此,给定这样的模型,如果你要问它 2022 年票房最高的电影是什么,它会说它不知道。

2023 年 7 月左右,有研究实验室声称发现了一种名为 LK99 的室温超导体。你可能在一些新闻中看到过这张照片。事实证明,这种说法不太正确。但是,如果你要问 LLM 关于 LK99 的问题,即使它在新闻中被广泛报道,如果 LLM 仅从截至 2022 年 1 月的互联网文本中学习,它将对此一无所知。这就是所谓的知识截止日期,即 LLM 仅了解世界到某个时间点为止的事情,即它接受训练的时间或上次从互联网下载的文本用于 LLM 训练的时间。

2.LLM 的第二个局限性是它们有时会凭空捏造事实,我们称之为幻觉。我发现如果我要求 LLM 给我一些历史名人的名言,它们经常会编造这些名言。例如,如果你问它,给我三句莎士比亚写的关于 Beyonce 的名言。由于莎士比亚在 Beyonce 之前很久就去世了,所以莎士比亚不可能说过任何关于 Beyonce 的事情。但是 LLM 会自信地回复你一些这类“名言”。

或者如果你要求它列出加利福尼亚州审理的关于 AI 的法院案件,它可能会给出看起来很权威的答案。但事实证明第一个案例是真实的,确实有 Waymo 与 Wombra 的案件,但我找不到 Incasol 与 Chevron 的案件。所以第二个案例是幻觉。有时LLM会以非常自信、权威的口吻产生幻觉或捏造事物。这可能会误导人们认为这种捏造的东西实际上可能是真实的。幻觉可能会产生严重的后果。

有一位律师不幸地使用 ChatGPT 为法律案件生成文本,并将其提交给法庭,但他并不知道自己提交给法庭的是一份包含大量虚构案件的法律文件。在这篇《纽约时报》的头条新闻中,我们看到在这个令人难堪的法庭听证会上,依赖 AI 的律师说他不明白聊天机器人会误导他。这位律师因提交包含虚构内容的诉讼文件而受到制裁。因此,如果你将它用于具有实际意义的文件,那么了解它的局限性非常重要。

3.LLM 还存在一个技术限制,即输入长度(即提示的长度)是有限的,它能生成的文本的输出长度也是有限的。

许多 LLM 最多只能设置几千个单词的提示词,你可以提供的上下文总量是有限的。因此,如果你要求它总结一篇论文,而该论文的长度远远超过此输入长度限制,则 LLM 可能会拒绝处理该输入。在这种情况下,你可能需要一次提供论文的一部分,并要求它一次总结论文的各个部分。或者有时你也可以找到具有更长输入限制长度的 LLM。从技术上讲,LLM 对所谓的上下文长度有限制。实际上,上下文长度是对总输入加输出大小的限制。

当我使用 LLM 时,我很少让它生成如此多的输出,以至于我还没遇到输出长度的限制。但是如果我的提示词内容有很多,我有时会遇到输入长度的限制,比方我想给它数千字的上下文。

4.生成式 AI 的一个重要限制是它们目前无法很好地处理结构化数据。

我所说的结构化数据是指表格数据,例如你可能存储在 Excel 或 Google Sheets 电子表格中的数据。比方,这是一个房价表,其中包含房屋面积(平方英尺)和房屋价格的数据。

如果你将所有这些数字输入到 LLM 中,然后问它,我有一栋 1,000 平方英尺的房子,你认为一个好的价格是多少?它不太擅长这个。相反,如果你将大小称为输入 A,将价格称为输出 B,那么监督学习将是一种更好的技术,可以用来估计价格作为大小的函数。

这是结构化数据(表格数据)的另一个示例,显示了不同的访问者可能何时访问你的网站,你向他们提供了多少产品以及他们是否购买了该产品。同样,监督学习将是一种比尝试将所有这些时间和价格和购买信息复制粘贴到大型语言模型的提示中更好的技术。

与结构化数据相反,生成式 AI 往往最适合处理非结构化数据。结构化数据是指你存储在电子表格中的表格数据,而非结构化数据是指文本、图像、音频、视频。生成式 AI 适用于所有这些类型的数据,尽管影响最大,这就是为什么我们将主要关注本课程中的文本数据。

5.最后,大型语言模型可能会输出偏见,并且有时会输出有毒或其他有害的言论。

大型语言模型是在互联网上的文本上训练的。不幸的是,互联网上的文本可以反映社会中存在的偏见。因此,如果你要 LLM完成句子,比方:外科医生走到停车场,拿出(?)。LM 可能会输出“他的车钥匙”,或者你说 护士走到停车场,拿出(?),它可能会说“她的电话”。在这种情况下,LLM 假设外科医生是男性,护士是女性。然而我们知道,显然外科医生和护士可以是任何性别。因此,如果你在应用程序中使用 LLM,而这些偏见可能会造成伤害,我建议在使用提示和应用 LLM 时要小心,以确保我们不会助长这些不良偏见(注:米国的政治正确也夸张了)。

最后,LLM偶尔也会输出有害或其他不良言论。例如,LLM有时会教人们如何做一些不良的,甚至是非法的行为。

幸运的是,所有主要的语言模型提供商都在努力提高这些模型的安全性,因此随着时间的推移,大多数模型都变得更加安全。如果你使用主要 LLM 提供商的网络界面,实际上随着时间的推移,让他们输出这些类型的有害言论变得越来越难。

以上总结了提示 LLM 可以做什么和不能做什么。正如我所提到的,下周我们将研究一些克服这些限制的技术,使 LLM 的功能更加广泛和强大。但首先,让我们看看一些关于提示 LLM 的技巧。我希望我在下一个视频中分享的技巧能立即对你使用 LLM 有所帮助。下个视频见。』

如何学习大模型 AI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

第一阶段(10天):初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。

  • 大模型 AI 能干什么?
  • 大模型是怎样获得「智能」的?
  • 用好 AI 的核心心法
  • 大模型应用业务架构
  • 大模型应用技术架构
  • 代码示例:向 GPT-3.5 灌入新知识
  • 提示工程的意义和核心思想
  • Prompt 典型构成
  • 指令调优方法论
  • 思维链和思维树
  • Prompt 攻击和防范

第二阶段(30天):高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。

  • 为什么要做 RAG
  • 搭建一个简单的 ChatPDF
  • 检索的基础概念
  • 什么是向量表示(Embeddings)
  • 向量数据库与向量检索
  • 基于向量检索的 RAG
  • 搭建 RAG 系统的扩展知识
  • 混合检索与 RAG-Fusion 简介
  • 向量模型本地部署

第三阶段(30天):模型训练

恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。

到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?

  • 为什么要做 RAG
  • 什么是模型
  • 什么是模型训练
  • 求解器 & 损失函数简介
  • 小实验2:手写一个简单的神经网络并训练它
  • 什么是训练/预训练/微调/轻量化微调
  • Transformer结构简介
  • 轻量化微调
  • 实验数据集的构建

第四阶段(20天):商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。

  • 硬件选型
  • 带你了解全球大模型
  • 使用国产大模型服务
  • 搭建 OpenAI 代理
  • 热身:基于阿里云 PAI 部署 Stable Diffusion
  • 在本地计算机运行大模型
  • 大模型的私有化部署
  • 基于 vLLM 部署大模型
  • 案例:如何优雅地在阿里云私有部署开源大模型
  • 部署一套开源 LLM 项目
  • 内容安全
  • 互联网信息服务算法备案

学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。

如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/10 7:27:23

Portainer实战:5步构建零基础CI/CD自动化部署流水线

Portainer实战:5步构建零基础CI/CD自动化部署流水线 【免费下载链接】portainer Portainer: 是一个开源的轻量级容器管理 UI,用于管理 Docker 和 Kubernetes 集群。它可以帮助用户轻松地部署、管理和监控容器,适合用于运维和开发团队。特点包…

作者头像 李华
网站建设 2026/4/14 21:56:32

Apertus多语言大模型:终极开源解决方案助力全球语言无障碍交流

在当今人工智能技术飞速发展的时代,Apertus多语言大模型以其1811种语言的原生支持能力和完全透明的开源架构,正在重新定义全球化AI应用的边界。这款由瑞士国家人工智能研究所开发的700亿参数模型,不仅实现了与闭源模型媲美的性能表现&#xf…

作者头像 李华
网站建设 2026/4/15 7:03:42

GKD自动化终极指南:告别重复点击,让手机更智能 [特殊字符]

GKD自动化终极指南:告别重复点击,让手机更智能 📱 【免费下载链接】gkd gkd-kit/gkd: 这个项目可能不存在或者已迁移,无法提供详细信息。 项目地址: https://gitcode.com/gh_mirrors/gk/gkd 你是否厌倦了每天在手机上重复点…

作者头像 李华
网站建设 2026/4/11 23:17:38

交换机.路由器.防火墙-技术提升【7.7】

5. 配置 Identity NAT 使用网络对象配置 Identity NAT 的操作过程如下。 ① (可选)为映射地址(与真实地址相同)配置网络对象。如果在 nat 命令中指定了 IP 地址作为内联,也可以跳过该步骤。 hostname(config)#object network obj_name hostname(config-network-object)#{h…

作者头像 李华