news 2026/5/14 22:29:09

PYTHON+AI LLM DAY FOURTY-FOUR

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
PYTHON+AI LLM DAY FOURTY-FOUR

今天简单介绍一个神经网络模型(ANN)的搭建过程:在这里采用(3,3),(3,2),(2,2)结构.大致意思就是说:输入层有3个神经元接收信息,隐藏层有两层.分别是:3个神经元接收输入层的信息,然后另外2个神经元接收隐藏层里3个神经元的信息.最后这两个神经元将信息交给输出层2个神经元.当然,后续要让这个模型更加复杂,主要是多添加隐藏层的层数,在输入层和输入层也可添加神经元持续优化.首先导入torch包和nn包里面的Module和Linear模块.由于Module模块已经写好了方法,此时只需要重写__init__魔法方法和forward前向传播方法具体为:def __init__(self,*args,**kwargs):

super().__init__(*args,**kwargs)然后就是定义神经网络结构:self.linear1 = Linear(3,3)

self.linear2 = Linear(3,2),self.out = Linear(2,2).初始化权重矩阵:这里分别用到了泽维尔正态初始化和凯明正态初始化.torch.nn.init.xavier_normal_(self.linear1.weight),torch.nn.init.kaiming_normal_

(self.linear2.weight),定义前向传播,每一层都是加权求和+激活函数. def forward(self,x),x = torch.

sigmoid(self.linear1(x)),x = torch.relu(self.linear2(x)),x = torch.softmax(self.out(x),dim=-1).return x

创建模型对象.创建一个变量接收前面创建的子类(重写Module模块那里),准备数据:data = torch.randn(5,3),3个特征,一定要与前面保持一致,5可以是任意数字.传给模型,打印输出即可.

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/14 22:22:24

如何用Motrix WebExtension实现浏览器下载效率翻倍:完整配置指南

如何用Motrix WebExtension实现浏览器下载效率翻倍:完整配置指南 【免费下载链接】motrix-webextension A browser extension for the Motrix Download Manager and its forks 项目地址: https://gitcode.com/gh_mirrors/mo/motrix-webextension 你是否厌倦了…

作者头像 李华
网站建设 2026/5/14 22:20:43

TQVaultAE深度解析:打造《泰坦之旅》终极仓库管理方案

TQVaultAE深度解析:打造《泰坦之旅》终极仓库管理方案 【免费下载链接】TQVaultAE Extra bank space for Titan Quest Anniversary Edition 项目地址: https://gitcode.com/gh_mirrors/tq/TQVaultAE 还在为《泰坦之旅》周年纪念版中堆积如山的装备无处存放而…

作者头像 李华
网站建设 2026/5/14 22:20:35

泳装爆款难出?先知大模型3天定版

泳装爆款难出?先知大模型3天定版每到春夏季,泳装老板们最怕什么?怕设计图改了十版仍被订货商否决,怕打板室堆满废样却赶不上第一波流量,更怕投入重金开发的系列最终无人问津。这种创意与效率的双重内耗,正在…

作者头像 李华
网站建设 2026/5/14 22:20:30

Elsevier投稿追踪:科研工作者的终极审稿进度自动监控方案

Elsevier投稿追踪:科研工作者的终极审稿进度自动监控方案 【免费下载链接】Elsevier-Tracker 项目地址: https://gitcode.com/gh_mirrors/el/Elsevier-Tracker 在科研投稿的漫长等待中,每天手动刷新Elsevier系统查看稿件状态已成为许多研究人员的…

作者头像 李华
网站建设 2026/5/14 22:20:18

从CRUD到架构师:一份可执行的成长清单

对于软件测试从业者而言,“CRUD”并非直接指代增删改查的编码动作,而是一种隐喻,象征着那些重复性高、技术含量有限、易于被工具或新人替代的日常工作。它可能是无休止的手工执行用例、是对着固定页面反复进行点点点、是机械地验证着千篇一律…

作者头像 李华