深度学习：pytorch 用官网自学dataloader(训练图片修改)_Linux

[at the heart of pytorch data loading utility is the torch.utils.data.dataloader class.]

准备：

启动

dataset

batch_size

shuffle

drop_last

准备：

1.pytorch官网链接pytorch

2.训练采用数据集准备

这里推荐用：cifar10(数据集)

执行下面代码，就可以下载了：download 设置为true

import torchvision
train_data = torchvision.datasets.cifar10(root="./dataset",
transform=torchvision.transforms.totensor(),
train=true,
download =true)
test_data = torchvision.datasets.cifar10(root="./dataset",
transform=torchvision.transforms.totensor(),
train=false,
download =true)

可以得到训练集train_data和测试集test_data。

3.关于dataloader的预备知识

torch.utils.data — pytorch 2.2 documentation

这是整个类，但今天我们重点讲的是函数dataloader

these options are configured by the constructor arguments of a dataloader

就是说功能可以由dataloader实现，又展示了这些参数。

截图自官网

启动

dataset

indicates a dataset object to load data from 即数据来源。

列举了一些（which has a default function）有默认值的。参考准备标题下的图片，可以发现真正要填的只有dataset即数据来源。根据文章开头下载的数据集，把test_data或train_data 填进去就行了。

batch_size

batch_size 这个参数控制的是一个步骤有多少图片，默认值是1，即每个步骤一张图片。

那我们再在tensorboard上面呈现一下。这里我就不填了，就是默认值1（代码直接放了，tensorboard之前讲过深度学习：pytorch 图片呈现 tensorboard (add_image)控制台自学调试检验，含终极代码-csdn博客

import torchvision
from torch.utils.tensorboard import summarywriter
from torch.utils.data import dataloader
trans_to = torchvision.transforms.totensor()
train_set = torchvision.datasets.cifar10(root="./dataset",transform= trans_to,train=true,download = false)
test_set = torchvision.datasets.cifar10(root = "./dataset",transform= trans_to,train =false ,download =false)
test_loader =dataloader(dataset=test_set)
writer = summarywriter('fff')
step = 0
for data in test_loader:
    imgs,targets =data
    writer.add_images("batch_size=1",imgs,step)
    step = step +1

writer.close()

（刚刚下载过了，我这里download就设置成false了，但你“./dataset”这个路径刚刚写的是什么这里就写什么不然识别不出来的）

board上就呈现出这个了。那我们试试看batch_size=64

test_loader =dataloader(dataset=test_set,batch_size=64)

然后把名称也改一下，改成batch_size=64 直观一点。

shuffle

默认有序，true的话要reshuffle（重新排序）

drop_last

默认是最后一步展现的图片会少一些。就是整个数据的个数可以不可以被你设置的batch_size整除，如果不可以，最后一步展示的必然与你设置的batch_size不同，而drop_last就是决定要不要展示剩余的图片，如果true则不展示，false则展示。

前面都是默认展示的，看看

这是刚刚的设置为64的，显然，我把其拖到最后一步，这一步里的数据一定没有64张，也确实没有。然后可以看到总共有156步。

那我改一下设置，设置其为true

test_loader =dataloader(dataset=test_set,batch_size=64,shuffle=true,drop_last=true)

最后一页还是有64张，但只有155步了。说明剩余的被删掉了。

那个

其他的，有兴趣试试。

提示：您在 /var/cache/apt/archives/ 上没有足够的可用空间，已解决

1、开发板使用的是树莓派，内存卡8G，Linux系统2、更新软件包时提示没有足够的空间。 [阅读全文]

【Linux】已解决E: Unable to fetch some archives, maybe run apt-get update or try with --fix-missing?

通过遵循上述步骤和注意事项，您应该能够轻松解决“E: Unable to fetch some archives, maybe run apt-get upda... [阅读全文]

hive 简简单单易如反掌

1. 实验一：Linux操作系统环境设置实验环境本实验所需之主要资源环境：资源环境服务器集群单节点，机器最低配置：双核 CPU、8GB 内存、100G 硬盘运行环境 Cen…

2024年07月31日 • 服务器

大数据集群搭建之Linux安装hadoop3，分布式架构演进+相关笔记参考

为了做好运维面试路上的助攻手，特整理了上百道。…

2024年07月31日 • 服务器

Linux系统下小白安装HDFS（Hadoop分布式文件系统）教程

本教程将帮助您在Linux操作系统上安装HDFS。HDFS（Hadoop分布式文件系统）是Apache Hadoop生态系统的核心组件之一。 [阅读全文]

Nginx实现灰度发布的常见方法小结

一、什么是灰度发布想象一下，你有一家生意火爆的餐厅，想要尝试推出一道新的招牌菜。但你又担心这道菜万一不受欢迎，会影响整个餐厅的声誉和生意。于是，你决定先只在一部... [阅读全文]


验证码：

验证码：

深度学习：pytorch 用官网自学dataloader(训练图片修改)

2024年07月31日 • Linux •我要评论

准备：

启动

dataset

batch_size

shuffle

drop_last

那个

相关文章:

hive 简简单单易如反掌

大数据集群搭建之Linux安装hadoop3，分布式架构演进+相关笔记参考

发表评论