当前位置: 代码网 > it编程>编程语言>Asp.net > Pandas实现(pivot_table函数)数据透视表方式

Pandas实现(pivot_table函数)数据透视表方式

2024年09月10日 Asp.net 我要评论
pandas (pivot_table函数)数据透视表使用pandas中的pivot_table()实现数据透视表。语法格式如下:pd.pivot_table(data,values=none,ind

pandas (pivot_table函数)数据透视表

使用pandas中的pivot_table()实现数据透视表。

语法格式如下:

pd.pivot_table(data,values=none,index=none,
			   columns=none,aggfunc='mean',fill_value=none,margins=false,dropna=true,
			   margins_name='all')

pd.pivot_table()有四个最重要的参数index、values、columns、aggfunc。

四个最重要参数解析

index

  • 相当于sql里的group by用于分组的字段,相当于行索引。
  • index也是层次字段,要通过透视表获取什么信息就按照相应的顺序设置字段。
pd.pivot_table(data,index=['列名1','列名2'])

values

  • 相当于sql里对列进行聚合计算
  • 对需要的计算数据进行筛选
pd.pivot_table(data,index=['列名1','列名2'],values=['计算列名1','计算列名2','计算列名3'])

columns

  • columns类似index可以设置列层次字段
  • 它不是一个必要参数,作为一种分割数据的可选方式
pd.pivot_table(data,index=['列名1','列名2'],
				values=['计算列名1','计算列名2','计算列名3'],columns=['列名3'])

aggfunc

  • aggfunc参数可以设置对数据聚合时进行的函数操作。
  • 对于aggfunc参数,操作的是values后面的值,而不是columns后面的值。
  • 分别对values参数中的每一列都进行求和与求平均值。
pd.pivot_table(data,index=['列名1','列名2'],
				values=['计算列名1','计算列名2','计算列名3'],aggfunc=[np.sum,np.mean])

fill_value:当数据为空时,填充的指定值。fill_value=0 

注意

  • aggfunc也可以使用dict类型,这样可以指定values中每一列的聚合函数。
  • 如果dict中的内容与values不匹配时,以dict中为准。
table=pd.pivot_table(data,index=['列名1','列名2'],columns=['列名3'],
					values=['计算列名1','计算列名2','计算列名3'],
					aggfunc={'计算列名1':np.mean,'计算列名2':[min, max, np.mean]},fill_value=0)

结果就是’计算列名2’求min,max和mean,'计算列名1’求mean,而’计算列名3’没有显示。

总结

以上为个人经验,希望能给大家一个参考,也希望大家多多支持代码网。

(0)

相关文章:

版权声明:本文内容由互联网用户贡献,该文观点仅代表作者本人。本站仅提供信息存储服务,不拥有所有权,不承担相关法律责任。 如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 2386932994@qq.com 举报,一经查实将立刻删除。

发表评论

验证码:
Copyright © 2017-2025  代码网 保留所有权利. 粤ICP备2024248653号
站长QQ:2386932994 | 联系邮箱:2386932994@qq.com