news 2026/5/6 12:52:22

AI核心知识60——大语言模型之NLP（简洁且通俗易懂版）

张小明

前端开发工程师

1.2k 24

文章封面图 — AI核心知识60——大语言模型之NLP（简洁且通俗易懂版）

自然语言处理(Natural Language Processing，简称NLP)是人工智能（AI）皇冠上最璀璨的一颗明珠。

在大语言模型 (LLM)的语境下，NLP 是“学科”与“工具”的关系：

NLP是学科（宏观领域）：它研究的是“如何让计算机听懂人话，并像人一样说话”。
LLM是工具（最新技术）：它是目前 NLP 领域最强大、最先进的技术解决方案。

简单来说：NLP是大模型的“祖师爷”和“应用场景”，而大模型是 NLP 发展了 70 年后进化出的“究极形态”。

1.🌉 核心任务：人机沟通的桥梁

计算机的母语是 0 和 1（二进制代码），人类的母语是自然语言（中文、英文等）。

这两者是完全不同的。

NLP的作用就是充当“翻译官”，它包含两个核心方向：

A. 让电脑“听懂” —— NLU (自然语言理解)

定义：Natural Language Understanding。
任务：把人类复杂的语言变成机器能懂的结构化数据。
LLM之前的做法：分词、词性标注、提取关键词。
LLM的做法：把文字变成向量 (Embedding)，计算语义关系，理解上下文和潜台词。
- 例子：你说“我今天蓝瘦香菇”。传统 NLP 可能分析出“蓝色、瘦、香菇”；LLM 能理解你是“难受想哭”。

B. 让电脑“会说” —— NLG (自然语言生成)

定义：Natural Language Generation。
任务：把机器的数据变成人类能读懂的通顺句子。
LLM之前的做法：填空模板（你好，[姓名]）、简单的拼凑。
LLM的做法：像人一样逐字预测，写诗、写代码、写小说。

2.📈 NLP 的进化史：为什么 LLM 是革命？

为了理解 NLP 在大模型里的地位，我们需要看一眼历史：

阶段	技术代表	特点	像什么？
规则时代 (1950s-1990s)	语法规则	科学家手工写几万条语法规则教电脑。	查字典的死板学生。如果不符合语法，电脑就报错。
统计时代 (1990s-2010s)	RNN / LSTM	让电脑算概率，“你好”后面大概率接“吗”。	只会背概率的计算器。能翻译，但句子经常不通顺。
大模型时代 (2018-现在)	Transformer (LLM)	大力出奇迹。把人类所有书籍都读一遍，理解了语言的深层规律。	博学多才的作家。不仅懂语法，还懂逻辑、懂世界知识。

以前的 NLP 是把任务拆开做的：翻译用翻译模型，聊天用聊天模型，分类用分类模型。

现在的 LLM (大模型)：一个模型解决所有 NLP 任务。你既可以让它翻译，也可以让它写诗，它通吃。

3.🛠️ NLP 具体包括哪些“手艺”？

当我们使用 ChatGPT 时，其实是在同时调用 NLP 领域的几十种传统能力：

机器翻译(Machine Translation)：中译英。
文本摘要 (Summarization)：帮我总结这篇文章。
情感分析(Sentiment Analysis)：这句话是夸我还是骂我？
命名实体识别(NER)：帮我从这句话里把“人名”、“地名”、“公司名”挑出来。
问答系统 (QA)：根据文档回答问题。

在大模型出现之前，这些是分开的独立研究方向；在大模型出现后，它们都变成了 Prompt（提示词）的一个指令。

总结

自然语言处理(NLP)就是“教计算机学语文”的科学。

在大语言模型中，NLP 是灵魂。没有 NLP 的理论基础（如 Tokenization, Embedding, Attention），就没有大模型；而大模型的出现，彻底重写了 NLP 这门学科，让它从“人工规则”变成了“智能涌现”。

版权声明: 本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若内容造成侵权/违法违规/事实不符，请联系邮箱：809451989@qq.com进行投诉反馈，一经查实，立即删除！

网站建设 2026/5/3 20:46:12

揭秘Open-AutoGLM缩放手势识别：5步实现90%+准确率的优化路径

第一章：揭秘Open-AutoGLM缩放手势识别的核心机制Open-AutoGLM 是一种基于视觉语言模型（VLM）的创新性手势识别系统，专注于在多模态交互场景中实现高精度的缩放操作解析。其核心机制融合了动态关键点追踪、语义意图理解与自适应尺度…

作者头像

李华

网站建设 2026/5/1 6:18:06

【Open-AutoGLM滑动轨迹模拟】：揭秘自然手势背后的AI黑科技

第一章：【Open-AutoGLM滑动轨迹模拟】：揭秘自然手势背后的AI黑科技在智能设备交互日益追求“无感化”的今天，Open-AutoGLM滑动轨迹模拟技术凭借其对人类手势行为的深度建模，成为实现自然触控体验的核心引擎。该技术通过融合神经网…

作者头像

李华

网站建设 2026/5/1 12:19:28

1149 Dangerous Goods Packaging

#include <iostream> #include <vector> #include <map> using namespace std; int main() { int n, k, t1, t2; map<int, vector<int>> m; // 创建邻接表 cin >> n >> k; // 读取n和k for(int i 0;…

作者头像

李华

网站建设 2026/5/5 1:43:18

Excalidraw图形版本对比功能设想

Excalidraw图形版本对比功能设想在远程协作日益成为常态的今天，团队对可视化沟通工具的需求早已超越“画张图”这么简单。架构师用它勾勒系统拓扑，产品经理靠它串联业务流程，开发者拿它解释技术方案——Excalidraw 凭借其手绘风格的亲和力与…

作者头像

李华

网站建设 2026/5/3 9:00:57

Excalidraw图形一致性检查工具开发

Excalidraw图形一致性检查工具开发在现代技术团队的协作流程中，一张架构图往往比千行文档更有效。然而，当多个成员各自绘制图表时，风格混乱、术语不一、结构随意的问题接踵而至——有人用直角矩形画服务节点，有人却偏爱圆角&…

作者头像

李华

网站建设 2026/5/5 1:10:36

【稀缺资源】Open-AutoGLM表情包自动化采集框架首次曝光：精准识别率达98.7%

第一章：Open-AutoGLM表情包收集在人工智能与自然语言处理快速融合的背景下，Open-AutoGLM 作为一个实验性多模态模型框架，逐步展现出其在非结构化数据理解上的潜力。其中，表情包作为网络社交中高频使用的表达载体，成为训…

作者头像

李华