看过来
《pandas 教程》 持续更新中,提供建议、纠错、催更等加作者微信: gr99123(备注:pandas教程)和关注公众号「盖若」ID: gairuo。跟作者学习,请进入 Python学习课程。欢迎关注作者出版的书籍:《深入浅出Pandas》 和 《Python之光》。
(编码题)行政部从考勤系统导出的 8 月前 5 天数据,缺失标记如下:
import pandas as pd
import numpy as np
df = pd.DataFrame({
"员工": ["张三", "李四", "王五", "赵六", "孙七"],
"迟到分钟": [0, np.nan, 5, np.nan, 3],
"请假天数": [np.nan, 1, 0, 2, np.nan],
"加班小时": [np.nan, np.nan, 4, 1, 2]
})
df
# ...
用 一行 fillna()
按列完成补全规则,并打印结果:
迟到分钟
→ 用 0 填充(从未迟到)请假天数
→ 用 列中位数 填充加班小时
→ 用 列均值 填充代码如下:
df.fillna({
'迟到分钟': 0,
'请假天数': df['请假天数'].median(),
'加班小时': df['加班小时'].mean()
})
输出示例:
员工 迟到分钟 请假天数 加班小时
0 张三 0.0 1.0 2.333333
1 李四 0.0 1.0 2.333333
2 王五 5.0 0.0 4.000000
3 赵六 0.0 2.0 1.000000
4 孙七 3.0 1.0 2.000000
(完)
更新时间:2025-08-21 17:59:10 标签:pandas python 补全 缺失值