当前位置: 代码网 > it编程>前端脚本>Python > 【数据分析】统计学基础及Python具体实现

【数据分析】统计学基础及Python具体实现

2024年07月31日 Python 我要评论
统计学概述个人大佬的,将是我成长路上阿川水平有限,如,欢迎大佬。
各位大佬好 ,这里是阿川的博客,祝您变得更强

在这里插入图片描述 个人主页在线oj的阿川

大佬的支持和鼓励,将是我成长路上最大的动力在这里插入图片描述

阿川水平有限,如有错误,欢迎大佬指正在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

统计学概述

统计学主要是描述和推断

  • 描述

    • 分类数据
      • 有限数量的类别的数据
        • 定序
          • 顺序
            • 例如金银铜三枚奖牌,金大于大于
        • 定类
          • 例如猫的种类,不能说有顺序
  • 请添加图片描述

    • 数值数据
      • 可进行数学运算和统计分析计算有意义的数据
        • 连续
          • 例如1~2之间区间有很多连续的数字
        • 离散
          • 只能以整数或自然数为单位的数据

图2

数值数据分析维度

数值数据是数据分析的重点,分析维度主要从三个方面来分析

  • 集中趋势
    • 数据集中分布在哪里

在这里插入图片描述

  • mean平均数

请添加图片描述

  • median中位数

请添加图片描述

  • mode众数

请添加图片描述

  • 离散趋势
    • 数据偏离中心分布在哪里

在这里插入图片描述

  • max-min极差

请添加图片描述

  • var/std 方差/标准差

请添加图片描述

  • quantile(0.75)- quantile(0.25)四分位距

    • 四分位距是将数据按顺序,按四等分分好并排序,处于三个分割点位置的数值就是四分位数-
    • 表示中间一半数值的离散程度
      • 越大说明数据越分散
      • 越小说明数据越集中

在这里插入图片描述

请添加图片描述

  • 分布形状

在这里插入图片描述

  • 可以看出数据的偏态、峰度、异常值
  • 分布形状主要是指直方图
    plot 表示画图
    • kind参数具体什么形状
      • hist表示直方图

请添加图片描述

偏态解释

直方图一般为正态分布(平均值、中位数、众数差不多都位于中央

请添加图片描述

偏态(平均数、中位数、众数偏离中央

  • 正偏态即右偏态

  • 负偏态及左偏态

请添加图片描述请添加图片描述

注意一下直方图

  • 数据量小,分布形状较不明显
  • 数据量大,分布形状较明显

好的,到此为止啦,祝您变得更强

在这里插入图片描述
想说的话

实不相瞒,写的每篇博客都要写三四个小时(加上自己学习和纸质笔记,共五六小时吧),很累希望大佬支持

在这里插入图片描述

道阻且长 行则将至
个人主页:在线oj的阿川大佬的支持和鼓励,将是我成长路上最大的动力 在这里插入图片描述
(0)

相关文章:

版权声明:本文内容由互联网用户贡献,该文观点仅代表作者本人。本站仅提供信息存储服务,不拥有所有权,不承担相关法律责任。 如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 2386932994@qq.com 举报,一经查实将立刻删除。

发表评论

验证码:
Copyright © 2017-2025  代码网 保留所有权利. 粤ICP备2024248653号
站长QQ:2386932994 | 联系邮箱:2386932994@qq.com