看过来
《pandas 教程》 持续更新中,提供建议、纠错、催更等加作者微信: gairuo123(备注:pandas教程)和关注公众号「盖若」ID: gairuo。跟作者学习,请进入 Python学习课程。欢迎关注作者出版的书籍:《深入浅出Pandas》 和 《Python之光》。
pandas
的 count()
方法用于计算 DataFrame
或 Series
中非缺失值的数量。这个方法对于了解数据的完整性和非空值的分布情况非常有用。
DataFrame.count(axis=0, numeric_only=False)
None, NaN, NaT, pandas.NA 都会被认为是缺失值。
axis
: 可选。用于指定沿哪个轴计算非缺失值的数量。默认值为 0
或 'index'
,即按列计算。如果设置为 1
或 'columns'
,则按行计算。numeric_only
: 可选。布尔值,默认值为 False
。如果为 True
,则只计算数字类型的列。返回一个 Series
,其索引是被计算的 DataFrame
的列名(或行索引),值是每个列(或行)中非缺失值的数量。
假设有一个包含多个变量的数据集,我们希望计算每列中非缺失值的数量。
df = pd.DataFrame({"Person":
["John", "Myla", "Lewis", "John", "Myla"],
"Age": [24., np.nan, 21., 33, 26],
"Single": [False, True, True, True, False]})
df
'''
Person Age Single
0 John 24.0 False
1 Myla NaN True
2 Lewis 21.0 True
3 John 33.0 True
4 Myla 26.0 False
'''
# 请注意未计数的NA值:
df.count()
'''
Person 5
Age 4
Single 5
dtype: int64
'''
# 每行计数:
df.count(axis='columns')
'''
0 3
1 2
2 3
3 3
4 3
dtype: int64
'''
这些结果帮助我们理解数据的完整性和非缺失值的分布情况。
更新时间:2024-08-08 08:20:16 标签:pandas python 缺失值 数量