8、机器学习中的模型选择、生产管道与降维技术-开发者社区

机器学习中的模型选择、生产管道与降维技术

1. 信用卡欺诈检测模型选择与生产管道

在信用卡欺诈检测任务中，我们对集成模型进行了评估。从精确率 - 召回率曲线、平均精确率和 auROC 曲线来看，集成模型并没有带来性能上的提升。因此，我们选择了独立的 LightGBM 梯度提升模型用于生产，因为它更为简单。

在为新交易创建处理管道之前，我们先对 LightGBM 模型在测试集上区分欺诈交易和正常交易的能力进行了可视化。从预测概率图来看，该模型能较好地为实际欺诈交易赋予高欺诈概率，为正常交易赋予低欺诈概率，但偶尔也会出现误判。

接下来我们设计了一个简单的生产管道，用于处理新的交易数据，具体步骤如下：
1.加载数据：将新数据导入到名为newData的数据框中。
2.特征缩放：对特定特征进行缩放处理。

# first, import new data into a dataframe called 'newData' # second, scale data # newData.loc[:,featuresToScale] = sX.transform(newData[featuresToScale])

生成预测：使用已经训练好的 LightGBM 模型进行预测。

19、基于受限玻尔兹曼机的推荐系统

基于受限玻尔兹曼机的推荐系统在机器学习领域，推荐系统是一项非常成功的应用，广泛应用于电影、音乐、书籍等多个领域。本文将介绍如何使用受限玻尔兹曼机（RBM）构建推荐系统，同时会涉及到数据处理、矩阵分解等相关技术。 1. 生成式无监督模型与受限玻尔兹曼机在机器学…

李华

22、深度信念网络与生成对抗网络：从无监督学习到图像分类

深度信念网络与生成对抗网络：从无监督学习到图像分类 1. 深度信念网络（DBN）训练原理 1.1 DBN训练机制在DBN训练中，已训练的三个受限玻尔兹曼机（RBM）各自拥有权重矩阵、隐藏偏置向量和可见偏置向量。在训练作为DBN一部分的第四个RBM时，不会调整前三个RBM的权重矩阵、…

李华

修复 EKS CloudWatch Agent 无法访问 IMDS 问题

问题现象在 EKS 集群中，部分节点上的 CloudWatch Agent Pods 持续处于 CrashLoopBackOff 状态，查看日志发现以下错误： E! [EC2] Fetch identity document from EC2 metadata fail: EC2MetadataRequestError: failed to get EC2 instance identity document caused by: EC…

李华

AIGC与CI/CD的深度融合：在流水线中嵌入AI测试评估节点

从自动化到智能化，测试节点的范式转移‌ 随着以大型语言模型（LLM）、多模态模型为代表的AIGC技术走向成熟，软件测试领域正迎来从“脚本执行自动化”向“测试活动智能化”的根本性跨越。传统的CI/CD流水线虽然实现了构建、部署、基础…

李华

5分钟快速上手Potrace：从位图到矢量的终极转换指南

5分钟快速上手Potrace：从位图到矢量的终极转换指南【免费下载链接】potrace [mirror] Tool for tracing a bitmap, which means, transforming a bitmap into a smooth, scalable image 项目地址: https://gitcode.com/gh_mirrors/pot/potrace 在数字设计领…

李华

跨平台直播聚合开发指南：构建多源直播应用实战

跨平台直播聚合开发指南：构建多源直播应用实战【免费下载链接】dart_simple_live 简简单单的看直播项目地址: https://gitcode.com/GitHub_Trending/da/dart_simple_live 在移动互联网时代，直播已成为重要的娱乐和信息获取方式。面对各大直播平…

李华