Python学习笔记:SQL中group_concat分组合并操作实现
一、背景
如何利用 Pandas
实现 SQL
中的 group_concat
操作?
二、实操
1.构造测试数据集
import pandas as pdimport numpy as npdf = pd.DataFrame({'name':['小明','小明','小明','小红','小三','小三'],'value':[10,20,20,20,200,500]})df''' name value0小明 101小明 202小明 203小红 204小三2005小三500'''
2.默认分组合并
- groupby 实现分组
- 匿名函数实现转换为列表
- reset_index 实现索引重置
# NOT WORKdf.groupby("name").agg({"value":list})# TypeError: 'type' object is not iterable# 修改df.groupby("name").agg({"value": lambda x: x.tolist()}).reset_index()''' name value0小三[200, 500]1小明 [10, 20, 20]2小红 [20]'''
3.指定符号
利用 join
函数实现字符串连接。
df.astype(str).groupby("name").apply(lambda x: ';'.join(x.value))'''name小三 200;500小明10;20;20小红 20dtype: object'''# 还可以换行、转换成数据框(df.astype(str).groupby("name").apply(lambda x: ';'.join(x.value)).to_frame("value").reset_index())''' name value0小三200;5001小明 10;20;202小红20'''
4.去重显示
df.groupby("name").agg({'value':'unique'}).reset_index()''' namevalue0小三 [200, 500]1小明[10, 20]2小红[20]'''
5.降序排列
(df.groupby("name").agg({"value": lambda x: x.tolist()})["value"].apply(lambda x: sorted(x, reverse=True)).reset_index())
作者:Hider1214
来源链接:https://www.cnblogs.com/hider/p/15554141.html
版权声明:
1、JavaClub(https://www.javaclub.cn)以学习交流为目的,由作者投稿、网友推荐和小编整理收藏优秀的IT技术及相关内容,包括但不限于文字、图片、音频、视频、软件、程序等,其均来自互联网,本站不享有版权,版权归原作者所有。
2、本站提供的内容仅用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯相关权利人及本网站的合法权利。
3、本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站(javaclubcn@163.com),我们将第一时间核实后及时予以删除。