pandas中quantile()函数的应用
quantile() 函数用于计算 dataframe 或 series 中数值型数据的分位数。
分位数是将数据分为等分的数值点,常用的分位数包括中位数(50% 分位数)、四分位数(25% 分位数和 75% 分位数)等。
下面是一个示例说明:
如何使用 quantile() 函数
import pandas as pd
# 创建一个 dataframe
data = {
'a': [1, 2, 3, 4, 5],
'b': [4, 5, 6, 7, 8],
'c': [7, 8, 9, 10, 11]
}
df = pd.dataframe(data)
# 计算整个 dataframe 的中位数(50% 分位数)
total_median = df.quantile(0.5)
print("total median (50th percentile) of dataframe:")
print(total_median)
# 计算每列的四分位数(25% 分位数和 75% 分位数)
column_quantile = df.quantile([0.25, 0.75])
print("\ncolumn quartiles (25th and 75th percentiles):")
print(column_quantile)
# 计算每行的分位数(20% 分位数和 80% 分位数)
row_quantile = df.quantile([0.2, 0.8], axis=1)
print("\nrow quantiles (20th and 80th percentiles):")
print(row_quantile)
输出结果:
total median (50th percentile) of dataframe:
a 3.0
b 6.0
c 9.0
name: 0.5, dtype: float64
column quartiles (25th and 75th percentiles):
a b c
0.25 2.0 5.0 8.0
0.75 4.0 7.0 10.0
row quantiles (20th and 80th percentiles):
0.2 0.8
0 1.4 6.6
1 2.6 7.4
2 3.8 8.2
3 4.6 9.4
4 5.4 9.8
在这个示例中
我们首先创建了一个 dataframe,并使用 quantile() 函数计算了整个 dataframe 的中位数(50% 分位数)、每列的四分位数(25% 分位数和 75% 分位数)以及每行的分位数(20% 分位数和 80% 分位数)。
可以通过指定百分位数来计算不同分位数的值,也可以通过指定 axis 参数来沿着行或列进行计算,默认情况下是对列进行计算分位数。
总结
以上为个人经验,希望能给大家一个参考,也希望大家多多支持代码网。
发表评论