说明
数据分析教程 正在计划编写中,欢迎大家加微信 gairuo123 (备注:数据分析教程) 提供意见、建议、纠错、催更。应大家要求,作者开办数据产品和数据分析培训班,详情 数据产品经理培训 / 数据分析培训。欢迎关注作者出版的书籍:《深入浅出Pandas》 和 《Python之光》。
中位数(Median)又称中值,统计学中的专有名词,是按顺序排列的一组数据中居于中间位置的数,代表一个样本、种群或概率分布中的一个数值,其可将数值集合划分为相等的上下两部分。
对于有限的数集,可以通过把所有观察值高低排序后找出正中间的一个作为中位数。 如果观察值有偶数个,通常取最中间的两个数值的平均数作为中位数。
主要应用于有极端值,且无某数据重复出现多次的情况下集中趋势的刻画。
收入中位数:中位数有助于了解普通民众的收入水平。而中位数与平均数的差异,则有助于了解全体民众的收入集中度。
例子:
3、13、7、5、21、23、39、23、40、23、14、12、56、23、29
顺序排列:
3、5、7, 12, 13, 14, 21, 23, 23, 23, 23, 29, 39, 40, 56
有 十五 个数。 正中位置是第八个:
3、5、7、12、 13、14、21、[23]、23、23、23、29、 39、40、56
这组数的中位数是 23。
即:
python 代码如下:
import numpy as np
r = np.random.default_rng(666)
# 奇数个值
x = r.integers(1, 10, size=9)
x
# array([9, 7, 3, 5, 1, 5, 4, 6, 5])
# x.sort() # array([1, 3, 4, 5, 5, 5, 6, 7, 9])
np.median(x)
# 5
# 偶数个值
y = r.integers(1, 10, size=10)
y
# array([4, 9, 3, 1, 3, 5, 5, 6, 5, 6])
# y.sort() # array([1, 3, 3, 4, 5, 5, 5, 6, 6, 9])
np.median(y)
# 5.0
可视化可参见平均值 Mean的可视化方法。
一般缺失值不参与计算。
更新时间:2021-01-13 14:18:00 标签:统计 数据分析