看过来
《pandas 教程》 持续更新中,提供建议、纠错、催更等加作者微信: gairuo123(备注:pandas教程)和关注公众号「盖若」ID: gairuo。跟作者学习,请进入 Python学习课程。欢迎关注作者出版的书籍:《深入浅出Pandas》 和 《Python之光》。
聚合分组非常常见,我们的数据是扁平化的,没有任何分组信息。比如你一周会多次去一家便利店,每次会产生一条购买记录,那么便利店想统计每个人这周的购买情况,就需要以人来进行分组,然后所有的金额相加,就得出每个人的购买额。
SQL 这样做分组和聚合:
SELECT Column1, Column2, mean(Column3), sum(Column4)
FROM SomeTable
GROUP BY Column1, Column2
上边的 SQL 是我们提取数据最常用的方法,接下来,我们将学习如何利用 Pandas 进行分组统计。
Pandas 也是按照 SQL 的思路,对数据进行非常灵活的分组,分组后会产生一个分组对象,接下来的操作就是就是对这个分组对象的操作。
针对分组对象,Pandas 操作了多个方面,如 agg 聚合、apply 自定义函数、迭代等,方便大家实现多种多样的聚合需求。
执行完分组统计计算后,再将数据拼成一个最终的数据返回给我们。
在接下来的教程中,让多体会一下 SQL 之外,Pandas 带给我们的惊喜!
更新时间:2022-04-29 21:50:30 标签:pandas 聚合 groupby