news 2026/6/24 7:14:04

2.8 WOE与IV值计算实战:特征筛选的黄金标准,附完整代码

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
2.8 WOE与IV值计算实战:特征筛选的黄金标准,附完整代码

2.8 WOE与IV值计算实战:特征筛选的黄金标准,附完整代码

引言

WOE(Weight of Evidence)和IV(Information Value)是评分卡模型中特征筛选的黄金标准。WOE用于特征转换,IV用于特征筛选。本文将提供完整的WOE和IV值计算代码,帮你掌握特征筛选的核心技能。

一、WOE和IV原理

1.1 WOE定义

WOE = ln(坏样本占比 / 好样本占比)

1.2 IV定义

IV = Σ(坏样本占比 - 好样本占比) × WOE

二、完整实现代码

2.1 WOE计算函数

# WOE计算完整代码importpandasaspdimportnumpyasnpdefcalculate_woe_iv(data,feature,target,n_bins=5,method='qcut'):""" 计算WOE和IV值 参数: data: DataFrame,包含特征和目标变量 feature: 特征列名 target: 目标变量列名(0/1,1表示坏样本) n_bins: 分箱数量 method: 分箱方法,'qcut'等频分箱,'cut'等距分箱 返回: woe_iv_df: 包含分箱、WOE、IV的DataFrame total_iv: 总IV值 """# 复制数据df=data[[feature,target]].copy()# 分箱ifmethod=='qcut':df['bin']=pd.qcut(df[feature],q=n_bins,duplicates='drop')else:df['bin']=pd.cut(df[feature],bins=n_bins,duplicates='drop')# 计算每箱统计bin_stats=df.groupby('bin').agg({target:['count','sum']})bin_stats.columns=['total','bad']bin_stats['good']=bin_stats['total']-bin_stats[
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/13 19:22:26

DecEx-RAG:过程监督+智能剪枝,让大模型检索推理快6倍

Agentic RAG 是当前 LLM 应用中一个非常火热的方向。与传统 RAG 不同它让模型在推理过程中自主决定要不要检索、什么时候检索。这样就相当于给模型一套工具让它自己判断该用哪个。 目前训练 Agentic RAG 的主流做法是结果监督强化学习:只在推理结束后给一个标量奖励…

作者头像 李华
网站建设 2026/6/19 0:43:52

1.44 NoteBookLM使用指南:Google的AI笔记工具,让文档变成智能助手

1.44 NoteBookLM使用指南:Google的AI笔记工具,让文档变成智能助手 引言 NoteBookLM是Google推出的AI笔记工具,可以将文档转换为智能助手。通过上传文档,NoteBookLM可以理解文档内容,回答相关问题,生成摘要和洞察。本文将详细介绍NoteBookLM的使用方法和最佳实践。 一、…

作者头像 李华
网站建设 2026/6/20 8:30:41

一位教师的使用分享:我是如何借助AI工具高效完成年终总结PPT的

本文仅分享个人提升工作效率的真实经验与工具使用心得,希望能为同样忙碌的同行们提供一个新思路。临近期末,除了繁重的教学收尾工作,相信许多老师和我一样,开始为一份重要的“期末作业”发愁——年度工作总结与述职PPT。上周在办公…

作者头像 李华
网站建设 2026/6/20 8:31:09

react组件外的变量是共用的

一直好奇如果一个组件被多次使用,那么在组件外写的变量是否共用,结果实验下来,发现的确是共用的A1.jsx组件App.jsx组件,里面调用2次A1.jsx组件1:点击"改变游戏名",对组件外变量进行修改2:点击第2个A1.jsx组件的查看console,发现组件外变量已经改变,但界面UI不更新.3:…

作者头像 李华
网站建设 2026/6/21 15:36:44

AI应用架构师必备:多智能体系统的资源管理

AI应用架构师必备:多智能体系统的资源管理策略与实践 摘要/引言 想象一个场景:在未来的自动驾驶车队中,10辆自动驾驶汽车正在城市道路上协同行驶。每辆车都有自己的感知智能体(处理摄像头、雷达数据)、决策智能体&…

作者头像 李华