深度学习 | Pytorch官方文档学习记录
从官方文档开始入手
Last Modified: 2022/1/13
深度学习 | Pytorch官方文档学习记录
提示:以下是本篇文章正文内容,下面案例可供参考
PYTORCH RECIPES
示例:pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。
LOADING DATA IN PYTORCH
Introduction
PyTorch数据加载实用程序的核心是torch.utils.data.DataLoader
类。它表示在数据集上的可迭代的 Python。
PyTorch 中的库提供内置的高质量数据集供您在torch.utils.data.Dataset
中使用。这些数据集目前可用于:
- torchvision
- torchaudio
- torchtext
还有更多。
通过使用来自torchaudio.datasets.YESNO
的Yesno
数据集,我们将演示如何有效且高效地将数据从PyTorch Dataset
加载到PyTorch DataLoader
。
Setup
在开始之前,我们需要安装torchaudio
才能访问数据集。pip install torchaudio
要在 Google Colab 中运行,请取消注释以下行:!pip install torchaudio
Steps
- 导入所有必要的库以加载我们的数据
对于这个
recipe
,我们将使用torch
和torchaudio
。根据您使用的内置数据集,您还可以安装和导入torchvision
或torchtext
。
- 访问数据集中的数据
torchaudio
中的Yesno
数据集包含 60 条关于一个人用希伯来语说是或否的录音;每个录音有八个字长。torchaudio.datasets.YESNO
为 YesNo 创建一个数据集。
torchaudio.datasets.YESNO(
root,
url='http://www.openslr.org/resources/1/waves_yesno.tar.gz',
folder_in_archive='waves_yesno',
download=False,
transform=None,
target_transform=None)
数据集中的每一项都是以下形式的元组:
(waveform, sample_rate, labels)
,其中labels
是一个整数列表,1
表示是,0
表示否。您必须为
Yesno
数据集设置root
,这是训练和测试数据集所在的位置。download
: 如果为 true,则从 Internet 下载数据集并将其放在根目录中。如果数据集已经下载,则不会再次下载。transform
:对数据使用转换可以让你从源状态中获取数据,并将其转换为连接在一起、去规范化并准备好进行训练的数据。PyTorch 中的每个库都支持不断增长的转换列表。target_transform
:一个函数/变换,它接受目标并对其进行变换。在实践中使用这些数据时,最好将数据配置为“training”数据集和“testing”数据集。这可确保您拥有样本外数据(out-of-sample data)来测试模型的性能。
- 加载数据
现在我们可以访问数据集,我们必须通过
torch.utils.data.DataLoader
传递它。DataLoader
将数据集和采样器组合在一起,返回数据集的可迭代对象。
- 遍历数据
- [可选] 可视化数据
参考链接
写本文时参考以下链接:
攻略
#todo: 带你少走弯路:强烈推荐的Pytorch快速入门资料和翻译(可下载)
#todo: 深度学习入门之 PyTorch