当前位置：代码网 > it编程>游戏开发>ar > huggingface下载的.arrow数据集读取与使用说明

huggingface下载的.arrow数据集读取与使用说明

2024年08月03日 • ar •我要评论

huggingface下载的arrow数据集读取与使用说明

1.数据下载方式：load_dataset

在这里插入图片描述

将数据集下载到本地：（此处下载的是一个物体目标检测的数据集）

from datasets import load_dataset
# 下载的数据集名称,
model_name = 'keremberke/plane-detection'
# 数据集保存的路径
save_path = 'datasets'
#name参数为full或mini，full表示下载全部数据，mini表示下载部分少量数据
dataset = load_dataset(model_name, name="full")  
dataset.save_to_disk(save_path)

huggingface可以把处理好的数据保存成下面的格式：
在这里插入图片描述
下载到本地后的数据结构如下：

2.加载本地的arrow文件：load_from_disk

from datasets import load_from_disk
path = './train' # train：表示上述训练集在本地的路径
dataset = load_from_disk(path)

数据以类似于表格的形式存储，包含以下列名：[‘image_id’, ‘image’, ‘width’, ‘height’, ‘objects’]

3.arrow文件中结构说明

在这里插入图片描述

print(dataset[0])
运行结果如下：
"""
{'image_id': 11, 'image': <pil.jpegimageplugin.jpegimagefile image mode=rgb size=1920x1080 at 0x2d70d08c3d0>, 'width': 1920, 'height': 1080, 'objects': {'id': [9], 'area': [36993], 'bbox': [[383.0, 268.0, 209.0, 177.0]], 'category': [0]}}
"""

显示图片：

img = dataset['image'][0]
plt.imshow(img)
plt.show()

显示标记框的示例代码如下：

# 取第一张图片
img = dataset['image'][0]
# 将pil--rgb格式图片转化为cv--bgr图片
cv_img = cv2.cvtcolor(numpy.asarray(img),cv2.color_rgb2bgr)
box_info = dataset['objects'][0]['bbox'][0]
p1 = [int(box_info[0]),int(box_info[1])]
p2 = [int(box_info[0]+box_info[2]),int(box_info[1]+box_info[3])]
cv2.rectangle(cv_img, p1, p2, (0, 255, 0), 2)
cv2.imshow("img", cv_img)
cv2.waitkey(0)

在这里插入图片描述

赞 (0)

相关文章:

ubuntu16.04下实现ROS+turtlebot2+rviz+gmapping建图自动导航

ubuntu16.04下实现ROS+turtlebot2+rviz+gmapping建图自动导航 [阅读全文]
Web3.0的五大趋势，你是否已经了解？

什么是 Web3？虽然 Web3 还没有大规模普及，但这个概念已经流传很久了。这是一个被人为创造出来的术语，用来归类一组在区块链技术上运行的软件和平台。但是，新技术不仅带来了新术语…

2024年08月03日 • 游戏开发
华为云CodeArts Snap荣获信通院优秀大模型案例及两项荣誉证书

传统自动化时代，需要消耗大量的测试开发人力开发测试代码，以实现测试执行自动化。同时，为进一步发挥AI技术在软件工程领域的潜力，充分释放AI赋予软件工程的价值，AI4SE工作组面向能…

2024年08月03日 • 游戏开发
华为---RSTP（四）---RSTP的保护功能简介和示例配置

为了更好保证RSTP协议在网络不稳定的情况下，尽可能保证流量的正常转发，在标准协议中新增了4种保护功能。BPDU保护边缘端口边缘端口收到BPDU后，把边缘端口shutdown。根保…

2024年08月03日 • 游戏开发
最全鸿蒙HarmonyOS实战-ArkUI组件（Image）_鸿蒙image组件(2)，零基础学HarmonyOS鸿蒙

该接口通过图片数据源获取图片，支持本地图片和网络图片的渲染展示。其中，src是图片的数据源。…

2024年08月03日 • 游戏开发
HarmonyOS应用签名、打Hap包、Hap调试包真机安装步骤

本文根据鸿蒙4.0版本文档，描述了鸿蒙app打包签名文件的生成、hap包打包及安装、鸿蒙应用真机安装等流程。…

2024年08月03日 • 游戏开发

版权声明：本文内容由互联网用户贡献，该文观点仅代表作者本人。本站仅提供信息存储服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 2386932994@qq.com 举报，一经查实将立刻删除。

发表评论


验证码：

Copyright © 2017-2026 代码网保留所有权利. 粤ICP备2024248653号
站长QQ:2386932994 | 联系邮箱：2386932994@qq.com