当前位置: 代码网 > it编程>前端脚本>Python > Pandas库中dataframe.corr()函数的使用

Pandas库中dataframe.corr()函数的使用

2024年07月22日 Python 我要评论
一、简介dataframe.corr()是pandas库中的一个函数,用于计算dataframe中各列之间的相关系数。相关系数衡量的是两个变量之间线性关系的强度和方向,结果在-1到1之间,分别表示完全

一、简介

dataframe.corr()是pandas库中的一个函数,用于计算dataframe中各列之间的相关系数。相关系数衡量的是两个变量之间线性关系的强度和方向,结果在-1到1之间,分别表示完全负相关和完全正相关。

二、语法和参数

dataframe.corr(method='pearson', min_periods=1)

method: 可选。计算相关系数的方法,有’pearson’(默认)、‘kendall’、'spearman’三种可选。

  • 'pearson':标准皮尔逊相关系数。
  • 'kendall':肯德尔等级相关系数。
  • 'spearman':斯皮尔曼等级相关系数。

min_periods: 可选。每对元素的最小数量,以便计算相关系数。

三、实例

3.1 计算默认的皮尔逊相关系数

import pandas as pd

# 创建示例数据
data = {
    'a': [1, 2, 3, 4, 5],
    'b': [5, 4, 3, 2, 1],
    'c': [2, 2, 3, 4, 4]
}
df = pd.dataframe(data)

# 计算相关系数
correlation_matrix = df.corr()
print(correlation_matrix)

输出:

          a         b         c
a  1.000000 -1.000000  0.948683
b -1.000000  1.000000 -0.948683
c  0.948683 -0.948683  1.000000

3.2 计算斯皮尔曼相关系数

import pandas as pd

# 创建示例数据
data = {
    'a': [1, 2, 3, 4, 5],
    'b': [5, 4, 3, 2, 1],
    'c': [2, 2, 3, 4, 4]
}
df = pd.dataframe(data)

# 计算相关系数
correlation_matrix = df.corr(method='spearman')
print(correlation_matrix)

输出:

          a         b         c
a  1.000000 -1.000000  0.948683
b -1.000000  1.000000 -0.948683
c  0.948683 -0.948683  1.000000

3.3 计算斯皮尔曼相关系数

import pandas as pd

# 创建示例数据
data = {
    'a': [1, 2, 3, 4, 5],
    'b': [5, 4, 3, 2, 1],
    'c': [2, 2, 3, 4, 4]
}
df = pd.dataframe(data)

# 计算相关系数
correlation_matrix = df.corr(method='kendall')
print(correlation_matrix)

输出

          a         b         c
a  1.000000 -1.000000  0.894427
b -1.000000  1.000000 -0.894427
c  0.894427 -0.894427  1.000000

四、注意事项

  • 当使用kendallspearman方法时,计算可能会比pearson方法慢,因为这些方法需要排序。
  • 如果数据集中存在nan值,默认情况下这些值会被忽略。
  • 计算相关系数前,确保数据已经清洗并准备好,以避免错误或不准确的结果。

到此这篇关于pandas库中dataframe.corr()函数的使用的文章就介绍到这了,更多相关pandas dataframe.corr()函数内容请搜索代码网以前的文章或继续浏览下面的相关文章希望大家以后多多支持代码网! 

(0)

相关文章:

版权声明:本文内容由互联网用户贡献,该文观点仅代表作者本人。本站仅提供信息存储服务,不拥有所有权,不承担相关法律责任。 如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 2386932994@qq.com 举报,一经查实将立刻删除。

发表评论

验证码:
Copyright © 2017-2025  代码网 保留所有权利. 粤ICP备2024248653号
站长QQ:2386932994 | 联系邮箱:2386932994@qq.com