看过来
《pandas 教程》 持续更新中,提供建议、纠错、催更等加作者微信: gr99123(备注:pandas教程)和关注公众号「盖若」ID: gairuo。跟作者学习,请进入 Python学习课程。欢迎关注作者出版的书籍:《深入浅出Pandas》 和 《Python之光》。
(编码题)在处理文本数据时,经常需要拆分字符串列。给定以下包含姓名和年龄的数据,要求使用.str.split()方法进行拆分处理。
import pandas as pd
data = {'info': ['张三_25_北京', '李四_30_上海', '王五_28_广州']}
df = pd.DataFrame(data)
print(df)
输出结果:
info
0 张三_25_北京
1 李四_30_上海
2 王五_28_广州
具体要求:
_
拆分成三列代码如下:
import pandas as pd
data = {'info': ['张三_25_北京', '李四_30_上海', '王五_28_广州']}
df = pd.DataFrame(data)
# 拆分字符串列
result = df['info'].str.split('_', expand=True)
result.columns = ['姓名', '年龄', '城市']
# 合并结果
final_df = pd.concat([df, result], axis=1)
print(final_df)
输出结果:
info 姓名 年龄 城市
0 张三_25_北京 张三 25 北京
1 李四_30_上海 李四 30 上海
2 王五_28_广州 王五 28 广州
参考代码的思路逻辑:首先使用.str.split()
方法按 _
分隔符拆分字符串,设置expand=True
参数将拆分结果转换为DataFrame。然后为拆分后的列指定新的列名,最后使用pd.concat()
将拆分结果与原始DataFrame按列方向合并,得到包含原始数据和拆分后数据的结果。这种方法既保留了原始数据,又获得了拆分后的结构化信息。
(完)
更新时间:2025-09-17 16:57:59 标签:pandas python 拆分 字符串列