type
Post
status
Published
date
Apr 23, 2026
slug
summary
tags
category
Agent相关分享
password
1. numpy(数字计算核心)
作用:
- 处理大量数字、数组、矩阵
- 做数学运算、统计、线性代数
- 是所有科学计算库的底层基础
通俗理解:
Python 自带的列表太慢、太弱,numpy 就是
高速数字工具箱
常见场景:
- 机器学习、深度学习数据处理
- 金融量化计算
- 信号处理、图像像素处理
- 大量数据的加减乘除、均值方差
2. pandas(表格数据神器)
作用:
- 处理表格型数据(像 Excel 一样)
- 读取、清洗、筛选、统计、合并表格
- 支持 CSV / Excel / JSON 等各种数据格式
通俗理解:
Python 里的
超级加强版 Excel
常见场景:
- 数据分析、业务报表
- 数据清洗、数据预处理
- 读取日志、订单、用户数据
- 做筛选、分组、求和、透视表
核心参数
dropna()
一、作用
- 删除含有缺失值的行或列
- 清理数据,避免 NaN 影响后续统计、建模、可视化
二、语法
三、参数详解
- axis:
0或index:删行(默认)1或columns:删列
- how:
'any':只要有一个 NaN 就删(默认)'all':全部是 NaN 才删
- thresh:int,保留至少有 thresh 个非空值的行 / 列
- subset:list,只检查指定列 / 行的 NaN
- inplace:
False:返回新 DataFrame(默认)True:直接修改原数据
pandas fillna ()
一、作用
fillna():填充缺失值 NaN,不是删除,是给空值补数据。- 业务必用:报表、统计、画图、算法都不能有 NaN
- 搭配
dropna():一个删空、一个补空
二、基础语法
三、全套常用写法
pandas groupby 详解
一、核心作用
groupby() = 分组聚合- 根据指定字段 / 列把数据分成多组
- 对每组单独做:求和、计数、均值、最大值、最小值、统计
- 类似 Excel 的「数据透视表 / 分类汇总」
常用聚合:
count()计数
sum()求和
mean()平均值
max()最大值
min()最小值
完整可运行示例
3. matplotlib(画图神器)
作用:
- 画各种图表:折线图、柱状图、散点图、直方图、热图等
- 数据可视化,把数字变成图
通俗理解:
Python 里的
专业绘图工具
常见场景:
- 数据分析结果展示
- 论文、报告配图
- 趋势分析、异常检测
- 可视化模型训练曲线
三者关系(一句话记住)
- numpy 负责底层数字计算
- pandas 负责表格数据处理
- matplotlib 负责把结果画成图
几乎所有:
数据分析、量化交易、机器学习、科研绘图
都会一起用这三个。
使用步骤
1.依赖安装
2.高频api
numpy(10 个高频)
pandas(10 个高频)
matplotlib(10 个高频)
使用案例
- Author:Ashland
- URL:http://preview.tangly1024.com/article/34bcccc0-3782-80e9-9bf1-f2c9abe903df
- Copyright:All articles in this blog, except for special statements, adopt BY-NC-SA agreement. Please indicate the source!





