如何用Python高效统计并排序大型商品数据集？_Python

如何用python高效统计并排序大型商品数据集？

利用python高效处理和排序大型商品数据集

本文演示如何将一个包含商品信息的列表高效地转换为另一个包含商品统计信息并按特定规则排序的列表。原始数据包含商品标题、颜色、尺码和数量，目标是统计相同标题、颜色和尺码的商品数量，并计算每个标题下所有商品的总数量，最终结果按总数量降序排列。

示例原始数据：

data = [
    ('连衣裙', '白色', 's', 1),
    ('连衣裙', '白色', 's', 1),
    ('连衣裙', '黑色', 'm', 1),
    ('裤子', '白色', 's', 1),
]

登录后复制

目标输出格式：

result = [
    ('连衣裙', '白色', 's', 2, 3),
    ('连衣裙', '黑色', 'm', 1, 3),
    ('裤子', '白色', 's', 1, 1),
]

登录后复制

其中，最后一个数字代表该标题下所有商品的总数量。为了高效处理大型数据集，我们将使用python的collections.counter对象进行计数。

以下代码实现了这一功能：

from collections import counter

data = [
    ('连衣裙', '白色', 's', 1),
    ('连衣裙', '白色', 's', 1),
    ('连衣裙', '黑色', 'm', 1),
    ('裤子', '白色', 's', 1),
]

# 使用counter统计每个(标题, 颜色, 尺码)组合的数量
item_counts = counter(tuple(item[:-1]) for item in data)

# 使用counter统计每个标题的总数量
title_totals = counter(item[0] for item in data)

# 创建结果列表，包含标题、颜色、尺码、数量和标题总数量
result = [
    (*item, count, title_totals[item[0]])
    for item, count in item_counts.items()
]

# 按标题总数量降序排序，然后按标题、颜色、尺码升序排序
result.sort(key=lambda x: (-x[4], x[0], x[1], x[2]))

print(result)

登录后复制

这段代码首先利用counter高效地统计每个商品组合和每个标题的出现次数。然后，它构造一个新的列表，包含所有必要的信息，并根据总数量进行排序。这种方法充分利用了counter的效率，能够轻松处理包含数千条甚至更多记录的大型数据集。

以上就是如何用python高效统计并排序大型商品数据集？的详细内容，更多请关注代码网其它相关文章！

LaTeX公式如何转换为可计算的代码逻辑？

将latex公式转换为可执行代码在科学计算和编程中，将latex数学公式转换为python、javascript等编程语言的代码是一个常见需求。然而，现有的工具... [阅读全文]

微信公众号新闻列表抓包失败怎么办？

微信公众号新闻列表抓包失败？charles和fiddler抓包失效的解决方法许多开发者在尝试获取微信公众号新闻列表数据时，常常遭遇抓包失败的难题。本文针对使用c... [阅读全文]

在tkinter中如何通过按钮实时控制电路模拟并解决常见逻辑问题？

在tkinter中使用按钮实时控制电路模拟的挑战我正在尝试构建一个简单的电路模拟器，使用tkinter界面来实时控制电路中的开关状态，从而观察电压和电流的变化。... [阅读全文]

家庭PC电脑能否转型为服务器？如何实现以及存在哪些不足？

家用pc：服务器改造的可行性与局限许多家庭用户都曾考虑将闲置的pc电脑改装成服务器，例如运行centos等专业系统。那么，家用pc能否胜任长时间运行的服务器任务... [阅读全文]

如何实现从Word插件跳转到浏览器进行登录授权？

应用内跳转至外部应用进行登录授权的实现方法许多应用都需要用户在外部应用（例如网站）进行登录授权。例如，一个word插件需要用户登录其官网进行授权。用户点击插件的... [阅读全文]

Python NumPy如何高效分割列表成固定数量的子列表？

利用numpy高效分割python列表在python编程中，常常需要将长列表分割成多个大小相同的子列表。本文介绍两种使用numpy库实现此目标的高效方法，并解答... [阅读全文]


验证码：

验证码：

如何用Python高效统计并排序大型商品数据集？

2025年03月30日 • Python •我要评论

相关文章:

发表评论