当前位置: 代码网 > it编程>前端脚本>Python > Python+pandas实现Excel连续数据分组求平均值

Python+pandas实现Excel连续数据分组求平均值

2025年11月03日 Python 我要评论
一、问题假设我们有以下 excel 数据:数据102030(空)515(空)100200300400(空)50我们的目标:根据空行划分分组;计算每组的 平均值;将结果插入 excel 对应的分组末尾行

一、问题

假设我们有以下 excel 数据:

数据
10
20
30
(空)
5
15
(空)
100
200
300
400
(空)
50

我们的目标:

  • 根据空行划分分组;
  • 计算每组的 平均值
  • 将结果插入 excel 对应的分组末尾行。

期望结果:

分组平均值
第1组20
第2组10
第3组250
第4组50

二、核心思路

  • 使用 pandas 读取 excel 文件;
  • 遍历数据列,用空值 (nan) 或表格末尾作为分组边界;
  • 对每组数字计算平均值;
  • 将结果插入新列“平均值”,显示在每个分组的结尾行;
  • 输出新的 excel 文件。

三、完整 python 代码

import pandas as pd

# === 1. 读取 excel 文件 ===
df = pd.read_excel("data.xlsx")
data = df["数据"].tolist()

# === 2. 连续数字分组求平均值 ===
groups = []
current_group = []

for x in data:
    if pd.isna(x):  # 遇到空行,计算当前组平均值
        if current_group:
            avg = sum(current_group) / len(current_group)
            groups.append(avg)
            current_group = []
    else:
        current_group.append(x)

# 处理最后一组(末尾没有空行的情况)
if current_group:
    avg = sum(current_group) / len(current_group)
    groups.append(avg)

# === 3. 将结果插入新列 ===
result_list = []
i = 0
current_group = []

for x in data:
    if pd.isna(x) or x == data[-1]:  # 空行或最后一行
        if i < len(groups):           # 防止越界
            result_list.append(groups[i])
            i += 1
        else:
            result_list.append(none)
    else:
        result_list.append(none)

# 处理最后一行是数字的情况
if len(result_list) < len(data):
    result_list.append(groups[-1])

df["平均值"] = result_list[:len(df)]

# === 4. 写入 excel 文件 ===
output_file = "data_avg_result.xlsx"
df.to_excel(output_file, index=false)

print("✅ 已生成新文件:", output_file)

四、运行效果

运行后生成文件 data_avg_result.xlsx

数据平均值
10
20
3020
(空)10
5
1510
(空)250
100
200
300
400250
(空)50
5050

每个分组的平均值自动填充在分组末尾行,非常直观。

五、扩展思路

  • 通用统计函数:可轻松改造成求和、最大值、最小值、计数等统计功能;
  • 批量处理 excel:利用 os 模块批量处理文件夹内的多个 excel 表格;
  • 数据可视化:将分组平均值绘制柱状图或折线图,直观展示趋势;
  • 高亮结果行:结合 openpyxlxlsxwriter 给平均值单元格设置颜色。

六、知识扩展

用 python 实现连续数据分组求和并回写

1.思路分析

核心思路如下:

  • 使用 pandas 读取 excel 文件;
  • 遍历数据列,用空值(nan)作为分组边界;
  • 每组内求和;
  • 在分组结束行插入结果;
  • 输出到新 excel 文件。

2.完整代码实现

import pandas as pd

# === 1. 读取 excel 文件 ===
# 请把 "data.xlsx" 改成你的文件名(路径也可以)
df = pd.read_excel("data.xlsx")

# 假设数据列名为 “数据”,若你的列名不同,请改成对应名字
data = df["数据"].tolist()

# === 2. 连续数字分组求和 ===
groups = []
group_sum = 0

for x in data:
    if pd.isna(x):  # 遇到空单元格 → 分组结束
        groups.append(group_sum)
        group_sum = 0
    else:
        group_sum += x

# 最后一组
if group_sum != 0 or (len(data) and pd.isna(data[-1])):
    groups.append(group_sum)

# === 3. 将结果保存为新列 ===
# 为保持对应关系,插入空行方便对齐
result_list = []
i = 0
group_sum = 0

for x in data:
    if pd.isna(x):
        result_list.append(groups[i])
        i += 1
    else:
        result_list.append(none)

# 若最后没有空行,也在末尾加上最后一个结果
if len(result_list) < len(data):
    result_list.append(groups[-1])

df["结果"] = result_list[:len(df)]

# === 4. 写入新 excel 文件 ===
output_file = "data_with_result.xlsx"
df.to_excel(output_file, index=false)

print("✅ 已生成新文件:", output_file)

4.运行效果

执行完代码后,会在当前目录生成一个名为:

data_with_result.xlsx

七、小结

本文介绍了一种常见且高效的 excel 自动化方法:使用 pandas 结合空行划分分组,自动计算每组的平均值。

核心思路一句话总结:“以空行为分组边界,按组计算平均值,并写回 excel。”

这种技巧在实验数据统计、财务报表、能源数据分析等场景中非常实用。

以上就是python+pandas实现excel连续数据分组求平均值的详细内容,更多关于python计算平均值的资料请关注代码网其它相关文章!

(0)

相关文章:

版权声明:本文内容由互联网用户贡献,该文观点仅代表作者本人。本站仅提供信息存储服务,不拥有所有权,不承担相关法律责任。 如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 2386932994@qq.com 举报,一经查实将立刻删除。

发表评论

验证码:
Copyright © 2017-2025  代码网 保留所有权利. 粤ICP备2024248653号
站长QQ:2386932994 | 联系邮箱:2386932994@qq.com