news 2026/5/5 2:12:23

Python基本库——Pandas

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Python基本库——Pandas

一、Pandas 核心概念

Pandas 是 Python 中用于数据清洗、数据处理、数据分析的核心库,就像 “Excel 升级版 + 数据库简化版”,能轻松处理表格型数据(比如 CSV、Excel 文件),比纯 Python 列表 / 字典处理数据效率高得多。

核心数据结构有两个:

  1. Series:一维数据(类似单列表格 / 带标签的数组),比如一列学生成绩;
  2. DataFrame:二维数据(类似完整的 Excel 表格),是 Pandas 最常用的结构,由行和列组成,每列可以是不同数据类型(数值、字符串、时间等)。

二、Pandas 基础使用(开箱即用代码)

1. 安装与导入(前置条件)

首先确保安装了 Pandas,终端执行:

bash

运行

pip install pandas # 如果需要读写Excel文件,额外安装: pip install openpyxl xlrd

导入 Pandas(惯例简写为 pd):

python

运行

import pandas as pd
2. 核心操作示例(新手必学)

python

运行

# 1. 创建DataFrame(模拟一份学生成绩数据) data = { "姓名": ["张三", "李四", "王五", "赵六"], "语文": [85, 92, 78, 88], "数学": [90, 80, 85, 95], "班级": ["一班", "二班", "一班", "二班"] } df = pd.DataFrame(data) # 2. 查看数据(基础探索) print("前2行数据:") print(df.head(2)) # 查看前n行,默认5行 print("\n数据基本信息:") print(df.info()) # 查看列名、数据类型、非空值数量 print("\n数值列统计信息:") print(df.describe()) # 均值、标准差、最值等 # 3. 数据筛选(按条件找数据) # 筛选数学成绩≥90的学生 high_math = df[df["数学"] >= 90] print("\n数学≥90分的学生:") print(high_math) # 4. 数据分组统计(按班级算平均分) class_avg = df.groupby("班级")[["语文", "数学"]].mean() print("\n各班级语文/数学平均分:") print(class_avg) # 5. 读写文件(实战常用) df.to_excel("学生成绩.xlsx", index=False) # 保存为Excel,index=False不保存行号 new_df = pd.read_excel("学生成绩.xlsx") # 读取Excel文件 print("\n从Excel读取的数据:") print(new_df)
代码执行效果示例:

plaintext

前2行数据: 姓名 语文 数学 班级 0 张三 85 90 一班 1 李四 92 80 二班 数据基本信息: <class 'pandas.core.frame.DataFrame'> RangeIndex: 4 entries, 0 to 3 Data columns (total 4 columns): # Column Non-Null Count Dtype --- ------ -------------- ----- 0 姓名 4 non-null object 1 语文 4 non-null int64 2 数学 4 non-null int64 3 班级 4 non-null object dtypes: int64(2), object(2) memory usage: 256.0+ bytes None 数值列统计信息: 语文 数学 count 4.000000 4.000000 mean 85.750000 87.500000 std 5.916080 6.454972 min 78.000000 80.000000 25% 83.250000 83.750000 50% 86.500000 87.500000 75% 89.000000 91.250000 max 92.000000 95.000000 数学≥90分的学生: 姓名 语文 数学 班级 0 张三 85 90 一班 3 赵六 88 95 二班 各班级语文/数学平均分: 语文 数学 班级 一班 81.5 87.5 二班 90.0 87.5 从Excel读取的数据: 姓名 语文 数学 班级 0 张三 85 90 一班 1 李四 92 80 二班 2 王五 78 85 一班 3 赵六 88 95 二班

三、Pandas 适用场景

  • 处理结构化数据:比如清洗爬虫数据、分析销售报表、整理问卷调查结果;
  • 数据预处理:机器学习前的缺失值填充、异常值处理、数据格式转换;
  • 快速统计分析:替代 Excel 做批量计算、分组汇总、多表合并。

总结

  1. Pandas 是 Python 处理表格数据的核心库,核心结构是Series(一维)DataFrame(二维)
  2. 新手先掌握:创建 / 查看数据、筛选数据、分组统计、读写文件这 4 个核心操作;
  3. Pandas 优势是高效处理大量数据,比 Excel 更灵活,比纯 Python 代码更简洁。
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/3 10:22:33

你还在手动排版?,掌握这4个VSCode快捷键秒变高效开发者

第一章&#xff1a;你还在手动排版&#xff1f;掌握VSCode快捷键的必要性在现代软件开发中&#xff0c;效率直接决定生产力。面对日益复杂的项目结构和频繁的代码调整&#xff0c;依赖鼠标操作进行排版和编辑已无法满足高效开发的需求。Visual Studio Code&#xff08;VSCode&a…

作者头像 李华
网站建设 2026/5/3 5:50:20

二次开发指南:基于CAM++ WebUI扩展自定义功能

二次开发指南&#xff1a;基于CAM WebUI扩展自定义功能 1. 引言&#xff1a;为什么需要二次开发&#xff1f; 你已经成功部署了 CAM 说话人识别系统&#xff0c;并能通过 WebUI 完成语音验证和特征提取。但如果你希望将这套能力集成到自己的项目中——比如做一个企业级身份核…

作者头像 李华
网站建设 2026/5/1 16:34:22

Cursor试用期限制终极解决方案:一键解除设备封锁

Cursor试用期限制终极解决方案&#xff1a;一键解除设备封锁 【免费下载链接】go-cursor-help 解决Cursor在免费订阅期间出现以下提示的问题: Youve reached your trial request limit. / Too many free trial accounts used on this machine. Please upgrade to pro. We have …

作者头像 李华
网站建设 2026/5/3 5:11:19

Android 基础入门教程2.6.4 DrawerLayout(官方侧滑菜单)的简单使用

2.6.4 DrawerLayout(官方侧滑菜单)的简单使用 分类 Android 基础入门教程 本节引言&#xff1a; 本节给大家带来基础UI控件部分的最后一个控件&#xff1a;DrawerLayout&#xff0c;官方给我们提供的一个侧滑菜单 控件&#xff0c;和上一节的ViewPager一样&#xff0c;3.0以后…

作者头像 李华
网站建设 2026/5/1 10:23:29

Goo Engine终极指南:打造惊艳动漫风格的完整教程

Goo Engine终极指南&#xff1a;打造惊艳动漫风格的完整教程 【免费下载链接】goo-engine Custom build of blender with some extra NPR features. 项目地址: https://gitcode.com/gh_mirrors/go/goo-engine 你是否曾梦想过创作出像《你的名字》或《鬼灭之刃》那样精美…

作者头像 李华
网站建设 2026/5/1 12:47:51

Faze4六轴机械臂:开源机器人技术深度解析

Faze4六轴机械臂&#xff1a;开源机器人技术深度解析 【免费下载链接】Faze4-Robotic-arm All files for 6 axis robot arm with cycloidal gearboxes . 项目地址: https://gitcode.com/gh_mirrors/fa/Faze4-Robotic-arm 引言&#xff1a;重新定义工业机器人开发门槛 在…

作者头像 李华