看过来
《pandas 教程》 持续更新中,提供建议、纠错、催更等加作者微信: gairuo123(备注:pandas教程)和关注公众号「盖若」ID: gairuo。跟作者学习,请进入 Python学习课程。欢迎关注作者出版的书籍:《深入浅出Pandas》 和 《Python之光》。
pandas
的 to_numpy
方法用于将 DataFrame 或 Series 转换为 numpy 数组。这在需要与 numpy 进行兼容操作时特别有用。
DataFrame
Series
对于 DataFrame 和 Series,语法如下:
DataFrame.to_numpy(dtype=None, copy=False, na_value=no_default)
Series.to_numpy(dtype=None, copy=False, na_value=no_default)
dtype
(dtype, 可选): 要强制转换数组元素类型的数据类型。如果为 None
,则保持数据类型不变。copy
(bool, 默认 False
): 如果为 True
,则总是复制数据,即使更改 dtype 也不在原地操作。na_value
(可选): 替代缺失值的值。如果为 no_default
,则保持缺失值为 numpy 的默认值。返回一个 numpy 数组。
pd.DataFrame({"A": [1, 2], "B": [3, 4]}).to_numpy()
'''
array([[1, 3],
[2, 4]])
'''
对于异构数据,必须使用最低的通用类型。
df = pd.DataFrame({"A": [1, 2], "B": [3.0, 4.5]})
df.to_numpy()
'''
array([[1. , 3. ],
[2. , 4.5]])
'''
对于数值和非数值类型的混合,输出数组将具有对象dtype。
df['C'] = pd.date_range('2000', periods=2)
df.to_numpy()
'''
array([[1, 3.0, Timestamp('2000-01-01 00:00:00')],
[2, 4.5, Timestamp('2000-01-02 00:00:00')]], dtype=object)
'''
通过这些示例,我们可以看到 to_numpy
方法在处理不同类型和规模的数据时的应用。它能够帮助我们将 pandas 数据结构转换为 numpy 数组,以便进行高效的数值计算和与其他库的兼容性操作。
更新时间:2024-08-05 20:05:27 标签:pandas python numpy