看过来
《pandas 教程》 持续更新中,提供建议、纠错、催更等加作者微信: gairuo123(备注:pandas教程)和关注公众号「盖若」ID: gairuo。跟作者学习,请进入 Python学习课程。欢迎关注作者出版的书籍:《深入浅出Pandas》 和 《Python之光》。
Series 和 Index 都用一些字符串处理方法,可以方便地进行操作,这些方法会自动排除丢失值和 NA 值。我们可以通过 str 属性访问它的方法,进行操作。
我们可以使用 .str.<method>
访问器(Accessors)来对内容进行字符操作:
s = pd.Series(['A', 'B', 'C', 'Aaba',
'Baca', np.nan, 'CABA',
'dog', 'cat'],
dtype="string")
# 转为小写
s.str.lower()
'''
0 a
1 b
2 c
3 aaba
4 baca
5 <NA>
6 caba
7 dog
8 cat
dtype: string
'''
对于非字符类型我们可以先进行转换,再使用:
# 转为 object
df.Q1.astype(str).str
# 转为 StringDtype
df.team.astype("string").str
df.Q1.astype(str).astype("string").str
大多数操作也适用于df.index
索引类型。
对索引的操作:
# 对索引进行操作
df.index.str.lower()
# 对表头,列名进行操作
df.columns.str.lower()
如果对数据连续进行字符操作,则每个操作都要使用 .str
方法:
df.columns.str.strip().str.lower().str.replace(' ', '_')
对于返回布尔值的操作可以用到 df.loc[]
操作里,进行逻辑筛选。
更新时间:2020-05-25 15:39:53 标签:pandas 字符