news 2026/3/1 13:31:57

人工智能应用- 语言处理:05. 神经网络方法:基于语义理解的诗人

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
人工智能应用- 语言处理:05. 神经网络方法:基于语义理解的诗人

不论是拼凑法还是统计模型,都没能充分保障诗句的“语义合理”。原因可以归结为两方面:一是对汉字的语义理解不足,二是对汉字的前后关系建模有限。

从语义上看,拼凑法完全没有理解语义,只是句子的机械裁剪和拼接;统计模型法只能简单描述字与字的共现规律,并没有深入理解语义。从字的前后关系建模上看,拼凑法和统计模型法只能建模近邻字之间的关系,没有关注长距离的句间依赖。

2014 年之后,神经网络(尤其是循环神经网络RNN 和Transformer 模型)取得突破,为AI 作诗带来“语义建模”能力。其中关键技术包括如下两点:

词向量嵌入:把汉字映射到连续向量空间。语义相近的字向量彼此接近,语义不同的字向量相互远离。这样就形成了一种基于向量距离的“理解”。汉字的向量表示具有重要意义,它让我们从汉字的表面形式深入语义理解,同时也让离散的汉字变得可计算,为更深一级的语义处理打下了基础。

序列建模:神经网络可以关注句子中任意位置的字并捕捉长距离依赖关系,更好地理解字与字、句与句之间的前后搭配关系,提诗句的自然度与语义连贯性。

清华大学的AI 诗人“薇薇”即采用了序列神经网络和注意力机制,将作诗视为“逐字生成”的过程:基于当前已生成的字串,预测下一个最合适的字。

下面是 AI 诗人“薇薇”创作的七言绝句《海棠花》

海棠花

红霞淡艳媚妆水,万朵千峰映碧垂。一夜东风吹雨过,满城春色在天辉。

在诗歌盲评中,诗词专家并不知道哪些诗由人写、哪些诗由“薇薇”写。结果显示:评分最高的前两首诗均出自“薇薇”,且有 31% 的 AI 作品被误判为“人类创作”,意味着 AI 已初步具备“拟人化”写诗的能力。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/2/26 7:37:53

人工智能应用- 语言处理:07. 大模型诗人

近年来,随着大语言模型的兴起,基于大语言模型的诗歌生成取得了显著进步。和“薇薇”等专为诗歌创作而训练的模型相比,大语言模型对词义的理解更深刻,对上下文的把握也更强。更重要的是,可以用自然语言方式提示诗歌的内…

作者头像 李华
网站建设 2026/2/26 0:32:06

2026冲刺用!更贴合继续教育的降AIGC网站 千笔·降AI率助手 VS WPS AI

在AI技术迅速发展的今天,越来越多的学生和研究者开始借助AI工具提升写作效率。然而,随着学术审查标准的不断提升,AI生成内容的痕迹愈发明显,论文中的AIGC率问题成为困扰众多学子的难题。尤其是在继续教育领域,如何在保…

作者头像 李华
网站建设 2026/2/26 10:43:33

[特殊字符][特殊字符]天津知名宠物友好设计:人宠共居的治愈空间

据某华北区域家居行业报告显示,天津养宠家庭占比已超35%,但不少养宠人都陷入“要么委屈毛孩子,要么牺牲家居质感”的两难——老房尖锐边角易让宠物磕碰,小户型塞下猫砂盆就没了活动空间,刚换的沙发几天就布满抓痕。而天…

作者头像 李华
网站建设 2026/2/28 13:11:28

给图书行业做 GEO(生成式引擎优化),核心不是把书“写得更好看”,而是把书“写得更可核验”

给图书行业做 GEO(生成式引擎优化),核心不是把书“写得更好看”,而是把书“写得更可核验”。在 AI 参与选书、荐书、比价与下单的时代,模型对内容的偏好正在从“营销形容词”转向“可被交叉验证的事实”。你可以把它理…

作者头像 李华
网站建设 2026/2/25 7:23:47

少走弯路:更贴合本科生的降AI率网站,千笔·降AI率助手 VS 笔捷Ai

在AI技术迅速发展的今天,越来越多的本科生开始借助AI工具辅助论文写作,以提升效率、优化内容。然而,随着各大查重系统对AI生成内容的识别能力不断提升,论文中的“AI痕迹”逐渐成为影响成绩的关键因素。许多学生在使用各类降AI率和…

作者头像 李华