news 2026/1/18 11:35:37

人工智能应用-机器视觉:绘画大师 02.​​​​​​​​​​​​​​深度神经网络中的内容与风格

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
人工智能应用-机器视觉:绘画大师 02.​​​​​​​​​​​​​​深度神经网络中的内容与风格

深度神经网络中的内容与风格

德国图宾根大学的研究者发现,一个用于图像识别的深度卷积神经网络,能够将图片的“内容”和“风格”分离开来。他们通过观察发现,在网络的较深层次,神经元的激发值可以还原图片中的物体,但会丢弃掉风格细节(下图上半部分)。

相反,神经元激发值之间的相关性则体现了色彩分布等风格信息(下图下半部分),而且随着网络层次的加深,神经元感受野逐步扩大,所代表的风格信息在空间尺度上也越来越大。

神经网络中对内容与风格的表示。图片来源:Gatys et al., 2016.

拓展阅读:神经网络中的风格矩阵

图片的风格体现在神经元激发值之间的关系矩阵上。那么,如何计算这个关系矩阵呢?设在卷积神经网络的第m层中有N个激活平面。我们将第i个激活平面表示为一个长向量F(m,i)。通过计算不同激活平面之间的关系,可以得到风格矩阵。

明确了内容和风格在神经网络中的表示方式后,可以采用一种“迭代更新法”来复现任意图片的内容或风格。例如,我们要复现某一参考图片C的内容。首先随机初始化一张噪声图片A,对该图片逐渐调整,使其在某一卷积层上的激发值F(A) 一点点趋近于参考图片在该卷积层上的激发值F(C)。调整过程一般采用梯度下降算法,损失函数是F(A) 和F(C) 之间的平方误差,即 ||F(A) −F(C)||2。下图展示了这一调整过程。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/1/18 11:29:33

论文AI率太高被退回?5招教你快速解决

论文AI率太高被退回?5招教你快速解决 TL;DR:论文被退回说AI率太高,别慌!这篇文章教你5招快速解决:了解AI率高的真正原因、避开3个常见误区、3个有效的手动修改技巧、借助专业工具快速降AI、最后再做一轮检查。按这个流…

作者头像 李华
网站建设 2026/1/18 11:27:11

互联网大厂Java求职面试实战:从核心Java到AI技术的全栈问答

互联网大厂Java求职面试实战:从核心Java到AI技术的全栈问答 场景背景 在国内某著名互联网大厂的Java开发岗位面试中,面试官严肃专业,求职者谢飞机则是个搞笑的水货程序员。面试内容涵盖Java核心语言、Spring生态、数据库、微服务、云原生、安…

作者头像 李华
网站建设 2026/1/18 11:15:03

端口的本质是什么

端口(Port)的本质是操作系统用于区分同一台主机上不同网络通信进程或服务的逻辑标识符。它不是物理设备,而是一个 16 位的整数(0~65535),与 IP 地址结合使用,构成“套接字地址(Socke…

作者头像 李华
网站建设 2026/1/18 11:14:10

Python_django的在线教育资源管理系统的设计与实现

目录摘要开发技术路线相关技术介绍核心代码参考示例结论源码lw获取/同行可拿货,招校园代理 :文章底部获取博主联系方式!摘要 在线教育资源管理系统基于Python的Django框架开发,旨在为教育机构提供高效、安全的资源管理平台。系统采用B/S架构…

作者头像 李华
网站建设 2026/1/18 11:13:39

用AI写论文的学生,反而比老师更懂“什么是真知识”

第一章 测试思维:解构AI论文的验证框架 作为质量守门人,测试工程师天然具备三重验证能力: 输入输出分析 - 识别AI论文的提示词工程本质,洞察知识重组逻辑 边界值测试 - 检测学术观点的极端案例覆盖性(如安全测试中的…

作者头像 李华
网站建设 2026/1/18 11:12:39

开题报告卡壳?虎贲等考 AI 一键解锁学术蓝图新姿势

还在为选题太泛被导师连环打回?还在因文献综述逻辑混乱熬秃脑袋?还在对着技术路线图无从下手?作为学术写作科普博主,后台每天都被开题报告的求助淹没。开题报告作为学术研究的 “施工图”,写不好不仅过不了答辩&#x…

作者头像 李华