当前位置: 代码网 > it编程>前端脚本>Python > Python读取Excel绘制直方图的方法

Python读取Excel绘制直方图的方法

2025年04月22日 Python 我要评论
以下将详细介绍如何使用 python 的pyecharts、matplotlib和seaborn三个库从 excel 中读取数据并绘制直方图(histogram)。直方图用于展示数据分布,核心是统计不

以下将详细介绍如何使用 python 的 pyechartsmatplotlib 和 seaborn 三个库从 excel 中读取数据并绘制直方图(histogram)。直方图用于展示数据分布,核心是统计不同区间的频数或频率。每个库的代码示例均包含核心类、函数和属性的详细说明。

1. 使用 pyecharts 绘制直方图

pyecharts 是基于 echarts 的交互式可视化库,但需手动计算直方图的频数分布(因无内置直方图函数)。

代码示例:

import pandas as pd
import numpy as np
from pyecharts.charts import bar
from pyecharts import options as opts
# 读取excel数据
df = pd.read_excel("data.xlsx")
data = df["数值列"].tolist()  # 假设数据列名为"数值列"
# 计算直方图的区间和频数
counts, bins = np.histogram(data, bins=10)  # 分10个区间
x_labels = [f"{bins[i]:.1f}-{bins[i+1]:.1f}" for i in range(len(bins)-1)]
# 创建柱状图(模拟直方图)
bar = bar()
bar.add_xaxis(x_labels)
bar.add_yaxis("频数", counts.tolist())
# 配置全局选项
bar.set_global_opts(
    title_opts=opts.titleopts(title="数值分布直方图"),
    xaxis_opts=opts.axisopts(name="区间"),
    yaxis_opts=opts.axisopts(name="频数"),
    toolbox_opts=opts.toolboxopts()
)
# 渲染为html文件
bar.render("pyecharts_histogram.html")

核心类与函数:

  • bar(): 柱状图对象,用于模拟直方图。
  • np.histogram(): 计算直方图频数和区间(bins 指定区间数量)。
  • add_xaxis()/add_yaxis(): 添加 x/y 轴数据。
  • set_global_opts(): 配置标题、坐标轴名称等。

2. 使用 matplotlib 绘制直方图

matplotlib 是基础绘图库,内置 hist() 函数直接绘制直方图。

代码示例:

import pandas as pd
import matplotlib.pyplot as plt
# 读取excel数据
df = pd.read_excel("data.xlsx")
data = df["数值列"]
# 创建画布和坐标系
fig, ax = plt.subplots(figsize=(10, 6))
# 绘制直方图
ax.hist(
    data, 
    bins=10,              # 区间数量
    color="skyblue",      # 颜色
    edgecolor="black",    # 边框颜色
    alpha=0.7,            # 透明度
    density=false         # false显示频数,true显示频率
)
# 添加标题和标签
ax.set_title("数值分布直方图", fontsize=14)
ax.set_xlabel("数值范围", fontsize=12)
ax.set_ylabel("频数", fontsize=12)
ax.grid(axis="y", linestyle="--")  # 显示横向网格线
# 显示图表
plt.tight_layout()
plt.savefig("matplotlib_histogram.png")
plt.show()

核心函数与参数:

  • ax.hist(): 直方图绘制函数。
    • bins: 区间数量或具体边界值(如 bins=[0, 10, 20])。
    • color/edgecolor: 填充色和边框颜色。
    • alpha: 透明度(0-1)。
    • density: 是否显示频率(归一化)。
  • ax.set_title()/ax.set_xlabel()/ax.set_ylabel(): 标题和坐标轴标签。

3. 使用 seaborn 绘制直方图

seaborn 基于 matplotlib,提供更简洁的语法和统计功能(如核密度估计)。

代码示例:

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
# 读取excel数据
df = pd.read_excel("data.xlsx")
data = df["数值列"]
# 设置主题
sns.set_theme(style="whitegrid", font="simhei")  # 中文需指定字体
# 创建直方图
plt.figure(figsize=(10, 6))
ax = sns.histplot(
    data,
    bins=10,                # 区间数量
    kde=true,               # 显示核密度曲线
    color="skyblue",        # 颜色
    edgecolor="black",      # 边框颜色
    stat="count"            # 统计类型(默认count,可选"density")
)
# 添加标题和标签
ax.set_title("数值分布直方图(带核密度估计)", fontsize=14)
ax.set_xlabel("数值范围", fontsize=12)
ax.set_ylabel("频数", fontsize=12)
# 显示图表
plt.tight_layout()
plt.savefig("seaborn_histogram.png")
plt.show()

核心函数与参数:

  • sns.histplot(): 直方图绘制函数。
    • kde: 是否显示核密度估计曲线(默认 false)。
    • stat: 统计类型("count" 频数,"density" 频率,"percent" 百分比)。
    • bins/color/edgecolor: 同 matplotlib
  • sns.set_theme(): 设置主题样式(如 whitegriddarkgrid)。

对比总结

特点适用场景
pyecharts需手动计算频数,生成交互式图表需要网页嵌入或动态交互
matplotlib直接绘制,高度可定制需要精细控制图表细节
seaborn语法简洁,支持核密度估计快速生成统计图表

注意事项

  • 数据预处理:确保 excel 中的目标列是数值类型(非字符串)。
  • 区间划分:调整 bins 参数优化数据分布展示(如 bins=20 增加细节)。
  • 交互性pyecharts 适合生成 html 文件,而 matplotlib/seaborn 适合静态图片。

到此这篇关于python读取excel绘制直方图的文章就介绍到这了,更多相关python读取excel绘制直方图内容请搜索代码网以前的文章或继续浏览下面的相关文章希望大家以后多多支持代码网!

(0)

相关文章:

版权声明:本文内容由互联网用户贡献,该文观点仅代表作者本人。本站仅提供信息存储服务,不拥有所有权,不承担相关法律责任。 如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 2386932994@qq.com 举报,一经查实将立刻删除。

发表评论

验证码:
Copyright © 2017-2025  代码网 保留所有权利. 粤ICP备2024248653号
站长QQ:2386932994 | 联系邮箱:2386932994@qq.com