看过来
《pandas 教程》 持续更新中,提供建议、纠错、催更等加作者微信: gairuo123(备注:pandas教程)和关注公众号「盖若」ID: gairuo。跟作者学习,请进入 Python学习课程。欢迎关注作者出版的书籍:《深入浅出Pandas》 和 《Python之光》。
pandas.RangeIndex
类是 Pandas 中非常高效的整数索引类型之一,类似于 Python 中的 range
,专门用于索引整数序列。它是 Index
类的子类,但与普通 Index
不同的是,RangeIndex
是为整数序列优化的,可以提高处理速度和内存效率。接下来详细介绍其语法、参数、属性和方法,以及使用场景。
class pandas.RangeIndex(start=None,
stop=None,
step=None,
dtype=None,
copy=False,
name=None)
start
:整数型,默认值为 0
。表示序列的起始值。stop
:整数型(必需参数)。表示序列的终止值(不包含在内)。step
:整数型,默认为 1
。表示步长,也就是序列的间隔大小。dtype
:数据类型,可选,默认为 int64
。指定索引值的数据类型。copy
:布尔型,默认值为 False
。是否强制创建数据的副本。name
:可选,索引的名称。返回一个 RangeIndex
对象,该对象可以像普通的 Index
那样用于索引 DataFrame 或 Series,但由于它是有序的整数索引,性能上更加高效。
RangeIndex
的属性start
:返回索引序列的起始值。stop
:返回索引序列的终止值。step
:返回索引序列的步长。name
:返回索引的名称。dtype
:返回索引的类型。RangeIndex
的方法RangeIndex.from_range(data, name=None, dtype=None)
构造一个范围索引对象RangeIndex
最常用于 DataFrame 和 Series 的默认索引,因为其效率极高,适合处理大规模数据的索引操作。它尤其适合那些需要使用顺序数列作为索引的场景。
RangeIndex
import pandas as pd
# 创建一个 RangeIndex 对象
index = pd.RangeIndex(start=0, stop=10, step=2)
# 输出
f"RangeIndex: {index}"
输出:
RangeIndex: RangeIndex(start=0, stop=10, step=2)
这个 RangeIndex
对象生成了一个从 0 开始、步长为 2 的索引序列,结果是:0, 2, 4, 6, 8。
# 使用 RangeIndex 作为 DataFrame 的索引
df = pd.DataFrame({'A': [1, 2, 3, 4, 5]}, index=index)
# 输出 DataFrame
f"DataFrame:\n{df}\n"
输出:
DataFrame:
A
0 1
2 2
4 3
6 4
8 5
在这个例子中,RangeIndex
被用作 DataFrame 的索引。索引从 0 开始,并且每隔两个数字生成一个索引。
name
参数# 带有名称的 RangeIndex
named_index = pd.RangeIndex(start=0, stop=5, name="my_index")
# 创建 DataFrame
df_named = pd.DataFrame({'B': [10, 20, 30, 40, 50]}, index=named_index)
# 输出 DataFrame
f"DataFrame with named RangeIndex:\n{df_named}\n"
输出:
DataFrame with named RangeIndex:
B
my_index
0 10
1 20
2 30
3 40
4 50
这个例子展示了如何为 RangeIndex
设置名称,并且该名称被应用于 DataFrame 的索引列。
to_frame
方法# 将 RangeIndex 转换为 DataFrame
index_frame = index.to_frame()
# 输出
f"RangeIndex as DataFrame:\n{index_frame}\n"
输出:
RangeIndex as DataFrame:
0
0 0
1 2
2 4
3 6
4 8
这里展示了如何将 RangeIndex
对象转换为一个 DataFrame,以便更灵活地使用它的数据。
pandas.RangeIndex
是 Pandas 中一个非常高效的索引类型,适合用于大规模整数序列的索引操作。它的轻量特性使其非常适合那些只需要简单整数序列作为索引的数据集。在需要较小内存占用和高效性能的场景中,它是默认且理想的选择。
更新时间:2024-10-22 19:40:27 标签:pandas python 范围索引 索引