pandas中DataFrame排序及分组排序的实现示例_Python

1. sort_values

pandas中的sort_values()函数原理类似于sql中的order by，可以将数据集依照某个字段中的数据进行排序，该函数即可根据指定列数据也可根据指定行的数据排序。

官方文档

## 参数    
dataframe.sort_values(by, axis=0, ascending=true, inplace=false, kind='quicksort', na_position='last')  
#### 参数说明    
axis:{0 or ‘index', 1 or ‘columns'}, default 0，默认按照索引排序，即纵向排序，如果为1，则是横向排序    
by:str or list of str；如果axis=0，那么by="列名"；如果axis=1，那么by="行名"；  
ascending:布尔型，true则升序，可以是[true,false]，即第一字段升序，第二个降序  
inplace:布尔型，是否用排序后的数据框替换现有的数据框  
kind:排序方法，{‘quicksort', ‘mergesort', ‘heapsort'}, default ‘quicksort'。似乎不用太关心  
na_position : {‘first', ‘last'}, default ‘last'，默认缺失值排在最后面

2. 排序sort_values

构建dataframe

import pandas as pd

df = pd.dataframe([['a', 100, 'c'], ['a', 300, 'a'], ['a', 200, 'b'],
                   ['c', 300, 'a'], ['c', 200, 'b'], ['c', 100, 'c'],
                   ['b', 200, 'b'], ['b', 300, 'a'], ['b', 100, 'c']], columns=['x', 'y', 'z'])

x y z
0 a 100 c
1 a 300 a
2 a 200 b
3 c 300 a
4 c 200 b
5 c 100 c
6 b 200 b
7 b 300 a
8 b 100 c

按照y, x两列对df进行降序排列

df.sort_values(by=['y', 'x'], ascending=false, inplace=true)
print(df)

x y z
3 c 300 a
7 b 300 a
1 a 300 a
4 c 200 b
6 b 200 b
2 a 200 b
5 c 100 c
8 b 100 c
0 a 100 c

3. 分组排序groupby|sort_values

按照x列进行分组后对y列进行升序排序

res = df.groupby('x', sort=false).apply(lambda x: x.sort_values('y', ascending=true)).reset_index(drop=true)
print(res)

x y z
0 a 100 c
1 a 200 b
2 a 300 a
3 c 100 c
4 c 200 b
5 c 300 a
6 b 100 c
7 b 200 b
8 b 300 a

示例：

创建数据框

#利用字典dict创建数据框
import numpy as np
import pandas as pd
df=pd.dataframe({'col1':['a','a','b',np.nan,'d','c'],
                 'col2':[2,1,9,8,7,7],
                 'col3':[0,1,9,4,2,8]
})
print(df)

>>>
  col1  col2  col3
0    a     2     0
1    a     1     1
2    b     9     9
3  nan     8     4
4    d     7     2
5    c     7     8

依据第一列排序，并将该列空值放在首位

#依据第一列排序，并将该列空值放在首位
print(df.sort_values(by=['col1'],na_position='first'))
>>>
  col1  col2  col3
3  nan     8     4
0    a     2     0
1    a     1     1
2    b     9     9
5    c     7     8
4    d     7     2

依据第二、三列，数值降序排序

#依据第二、三列，数值降序排序
print(df.sort_values(by=['col2','col3'],ascending=false))
>>>
  col1  col2  col3
2    b     9     9
3  nan     8     4
5    c     7     8
4    d     7     2
0    a     2     0
1    a     1     1

根据第一列中数值排序，按降序排列，并替换原数据

#根据第一列中数值排序，按降序排列，并替换原数据
df.sort_values(by=['col1'],ascending=false,inplace=true,
                     na_position='first')
print(df)
>>>
  col1  col2  col3
3  nan     8     4
4    d     7     2
5    c     7     8
2    b     9     9
1    a     1     1
0    a     2     0

按照索引值为0的行，即第一行的值来降序排序

x = pd.dataframe({'x1':[1,2,2,3],'x2':[4,3,2,1],'x3':[3,2,4,1]}) 
print(x)
#按照索引值为0的行，即第一行的值来降序排序
print(x.sort_values(by =0,ascending=false,axis=1))
>>>
   x1  x2  x3
0   1   4   3
1   2   3   2
2   2   2   4
3   3   1   1
   x2  x3  x1
0   4   3   1
1   3   2   2
2   2   4   2
3   1   1   3

到此这篇关于pandas中dataframe排序及分组排序的文章就介绍到这了,更多相关pandas 排序及分组排序内容请搜索代码网以前的文章或继续浏览下面的相关文章希望大家以后多多支持代码网！

Python的四种单例模式实现方式

★ 单例模式基本介绍单例模式是一种设计模式，用于确保一个类只有一个实例，并提供全局访问点以获取该实例。它是一种创建型模式，通常用于需要严格控制某个类的实例数量的... [阅读全文]

详解flask中如何获取不请求方式的参数

前言基于现在主流前后端交互的api，那么就来看看如何使用flask实现参数接受的。这里是我常用的方式，关于更多使用方式，请点击这里去文档查看更多一、get请求下1.1、路径中带有参…

2024年05月15日 • 前端脚本

python实现一个通用的插件类

本文提供了一种插件类的实现方案。定义插件管理器插件管理器用于注册、销毁、执行插件。import abcfrom functools import wrapsfr... [阅读全文]

pandas求行最大值及其索引的实现

在平时训练完模型后，需要对模型预测的值做进一步的数据操作，例如在对模型得到类别的概率值按行取最大值，并将最大值所在的列单独放一列。数据格式如下：arrayarr... [阅读全文]

使用Python实现绘制发散条形图

发散条形图用于简化多个组的比较。它的设计允许我们比较各组中的数值。它还帮助我们快速地想象出有利的和不利的或积极的和消极的反应。条形图由从中间开始的两个水平条的组... [阅读全文]

pandas中concat函数实现横向连接

在pandas中，concat函数可用于合并不同的series和dataframe对象。当需要将两个或多个dataframe对象在横向方向进行连接时，可以使用c... [阅读全文]


验证码：

验证码：

pandas中DataFrame排序及分组排序的实现示例

2024年05月15日 • Python •我要评论

1. sort_values

2. 排序sort_values

3. 分组排序groupby|sort_values

示例：

相关文章:

详解flask中如何获取不请求方式的参数

发表评论