看过来
《pandas 教程》 持续更新中,提供建议、纠错、催更等加作者微信: gr99123(备注:pandas教程)和关注公众号「盖若」ID: gairuo。跟作者学习,请进入 Python学习课程。欢迎关注作者出版的书籍:《深入浅出Pandas》 和 《Python之光》。
diff()
方法是 pandas 中用于计算相邻元素之间的差异的函数。它可以在 Series 或 DataFrame 对象上使用。以下是对该方法的详细讲解:
Series.diff(periods=1, axis=0)
DataFrame.diff(periods=1, axis=0)
参数说明:
periods
:要计算差分的时间步数。可以是正整数(向前差分)或负整数(向后差分)。默认为 1,表示计算与前一个元素的差异。axis
:指定要应用差分的轴向。对于 DataFrame,可以是 0 或 1,默认为 0。import pandas as pd
# 创建一个示例的 Series
data_series = pd.Series([10, 15, 8, 12, 6])
print("原始 Series 数据:")
print(data_series)
# 计算相邻元素之间的差异
diff_series = data_series.diff()
print("默认情况下的差分结果:")
print(diff_series)
输出:
原始 Series 数据:
0 10
1 15
2 8
3 12
4 6
dtype: int64
默认情况下的差分结果:
0 NaN
1 5.0
2 -7.0
3 4.0
4 -6.0
dtype: float64
# 计算每两个时间点之间的差异
diff_series_custom = data_series.diff(periods=2)
print("每两个时间点之间的差分结果:")
print(diff_series_custom)
输出:
每两个时间点之间的差分结果:
0 NaN
1 NaN
2 -2.0
3 4.0
4 -6.0
dtype: float64
# 创建一个示例的 DataFrame
data = {
'A': [10, 15, 8, 12, 6],
'B': [5, 3, 9, 14, 7]
}
df = pd.DataFrame(data)
print("原始 DataFrame 数据:")
print(df)
# 在 DataFrame 上计算每列的差分
diff_df = df.diff()
print("每列的差分结果:")
print(diff_df)
输出:
原始 DataFrame 数据:
A B
0 10 5
1 15 3
2 8 9
3 12 14
4 6 7
每列的差分结果:
A B
0 NaN NaN
1 5.0 -2.0
2 -7.0 6.0
3 4.0 5.0
4 -6.0 -7.0
这些示例展示了 diff()
方法如何在不同的数据结构中工作,并通过计算相邻元素之间的差异,提供了处理时间序列数据和其他连续数据的有力工具。
更新时间:2024-07-23 20:23:17 标签:pandas python 差值