看过来
《pandas 教程》 持续更新中,提供建议、纠错、催更等加作者微信: gairuo123(备注:pandas教程)和关注公众号「盖若」ID: gairuo。跟作者学习,请进入 Python学习课程。欢迎关注作者出版的书籍:《深入浅出Pandas》 和 《Python之光》。
(编码题)一个 Excel 名为 tmp.xlsx,CSV 名为 tmp.csv,如何用 pandas 读取时指定 DataFrame 一些列的类型?
%d%b%Y
Python 代码如下:
# dtype: Type name or dict of column -> type, default None
pd.read_excel(data, dtype=np.float64) # 所有数据均为此数据类型
pd.read_excel(data, dtype={'c1':np.float64, 'c2': str}) # 指定字段的类型
pd.read_excel(data, dtype=[datetime, datetime, str, float]) # 依次指定
# parse_dates: boolean or list of ints or names
# or list of lists or dict, default False.
pd.read_excel(data, parse_dates=True) # 自动解析日期时间格式
pd.read_excel(data, parse_dates=['年份']) # 指定日期时间字段进行解析
# 将 1、4 列合并解析成名为 时间的 时间类型列
pd.read_excel(data, parse_dates={'时间':[1,4]})
指定解析格式:
# date_parser,function, default None
pd.read_excel(data,
parse_dates=['年份'],
date_parser=lambda x: pd.to_datetime(x,
utc=True,
format='%d%b%Y')
)
注:CSV 的操作换作 pd.read_csv('tmp.csv', ...)
即可。
查看相关链接中的知识。
(完)
更新时间:2024-09-21 09:44:09 标签:pandas python excel 类型