人工智能应用- 语言处理：05. 神经网络方法：基于语义理解的诗人-开发者社区

不论是拼凑法还是统计模型，都没能充分保障诗句的“语义合理”。原因可以归结为两方面：一是对汉字的语义理解不足，二是对汉字的前后关系建模有限。

从语义上看，拼凑法完全没有理解语义，只是句子的机械裁剪和拼接；统计模型法只能简单描述字与字的共现规律，并没有深入理解语义。从字的前后关系建模上看，拼凑法和统计模型法只能建模近邻字之间的关系，没有关注长距离的句间依赖。

2014 年之后，神经网络（尤其是循环神经网络RNN 和Transformer 模型）取得突破，为AI 作诗带来“语义建模”能力。其中关键技术包括如下两点：

词向量嵌入：把汉字映射到连续向量空间。语义相近的字向量彼此接近，语义不同的字向量相互远离。这样就形成了一种基于向量距离的“理解”。汉字的向量表示具有重要意义，它让我们从汉字的表面形式深入语义理解，同时也让离散的汉字变得可计算，为更深一级的语义处理打下了基础。

序列建模：神经网络可以关注句子中任意位置的字并捕捉长距离依赖关系，更好地理解字与字、句与句之间的前后搭配关系，提诗句的自然度与语义连贯性。

清华大学的AI 诗人“薇薇”即采用了序列神经网络和注意力机制，将作诗视为“逐字生成”的过程：基于当前已生成的字串，预测下一个最合适的字。

下面是 AI 诗人“薇薇”创作的七言绝句《海棠花》

海棠花

红霞淡艳媚妆水，万朵千峰映碧垂。一夜东风吹雨过，满城春色在天辉。

在诗歌盲评中，诗词专家并不知道哪些诗由人写、哪些诗由“薇薇”写。结果显示：评分最高的前两首诗均出自“薇薇”，且有 31% 的 AI 作品被误判为“人类创作”，意味着 AI 已初步具备“拟人化”写诗的能力。

近年来，随着大语言模型的兴起，基于大语言模型的诗歌生成取得了显著进步。和“薇薇”等专为诗歌创作而训练的模型相比，大语言模型对词义的理解更深刻，对上下文的把握也更强。更重要的是，可以用自然语言方式提示诗歌的内…

李华

在AI技术迅速发展的今天，越来越多的学生和研究者开始借助AI工具提升写作效率。然而，随着学术审查标准的不断提升，AI生成内容的痕迹愈发明显，论文中的AIGC率问题成为困扰众多学子的难题。尤其是在继续教育领域，如何在保…

李华

据某华北区域家居行业报告显示，天津养宠家庭占比已超35%，但不少养宠人都陷入“要么委屈毛孩子，要么牺牲家居质感”的两难——老房尖锐边角易让宠物磕碰，小户型塞下猫砂盆就没了活动空间，刚换的沙发几天就布满抓痕。而天…

李华

给图书行业做 GEO（生成式引擎优化），核心不是把书“写得更好看”，而是把书“写得更可核验”。在 AI 参与选书、荐书、比价与下单的时代，模型对内容的偏好正在从“营销形容词”转向“可被交叉验证的事实”。你可以把它理…

李华

在AI技术迅速发展的今天，越来越多的本科生开始借助AI工具辅助论文写作，以提升效率、优化内容。然而，随着各大查重系统对AI生成内容的识别能力不断提升，论文中的“AI痕迹”逐渐成为影响成绩的关键因素。许多学生在使用各类降AI率和…

李华

你写论文时是不是也这样？ 查资料、列提纲、反复修改逻辑，连标点都校对三遍——交上去前信心满满，结果一查重，重复率34%；再用AI检测工具一扫，系统直接警告：“高度疑似AI生成”。你愣住了&#…

李华

人工智能应用- 语言处理：07. 大模型诗人