欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

深度学习 | Pytorch官方文档学习记录

程序员文章站 2022-06-11 22:06:55
...

从官方文档开始入手
Last Modified: 2022/1/13



提示:以下是本篇文章正文内容,下面案例可供参考


PYTORCH RECIPES

示例:pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。

LOADING DATA IN PYTORCH

Introduction

PyTorch数据加载实用程序的核心是torch.utils.data.DataLoader类。它表示在数据集上的可迭代的 Python。
PyTorch 中的库提供内置的高质量数据集供您在torch.utils.data.Dataset中使用。这些数据集目前可用于:

  • torchvision
  • torchaudio
  • torchtext

还有更多。

通过使用来自torchaudio.datasets.YESNOYesno数据集,我们将演示如何有效且高效地将数据从PyTorch Dataset加载到PyTorch DataLoader

Setup

在开始之前,我们需要安装torchaudio才能访问数据集。
pip install torchaudio

要在 Google Colab 中运行,请取消注释以下行:
!pip install torchaudio

Steps

  1. 导入所有必要的库以加载我们的数据

对于这个recipe,我们将使用torchtorchaudio。根据您使用的内置数据集,您还可以安装和导入torchvisiontorchtext

  1. 访问数据集中的数据

torchaudio中的Yesno数据集包含 60 条关于一个人用希伯来语说是或否的录音;每个录音有八个字长。
torchaudio.datasets.YESNO为 YesNo 创建一个数据集。

torchaudio.datasets.YESNO(
     root,
     url='http://www.openslr.org/resources/1/waves_yesno.tar.gz',
     folder_in_archive='waves_yesno',
     download=False,
     transform=None,
     target_transform=None)

数据集中的每一项都是以下形式的元组:(waveform, sample_rate, labels),其中labels是一个整数列表,1表示是,0表示否。

您必须为 Yesno数据集设置root,这是训练和测试数据集所在的位置。

download: 如果为 true,则从 Internet 下载数据集并将其放在根目录中。如果数据集已经下载,则不会再次下载。

transform:对数据使用转换可以让你从源状态中获取数据,并将其转换为连接在一起、去规范化并准备好进行训练的数据。PyTorch 中的每个库都支持不断增长的转换列表。

target_transform:一个函数/变换,它接受目标并对其进行变换。

在实践中使用这些数据时,最好将数据配置为“training”数据集和“testing”数据集。这可确保您拥有样本外数据(out-of-sample data)来测试模型的性能。

  1. 加载数据

现在我们可以访问数据集,我们必须通过torch.utils.data.DataLoader传递它。 DataLoader将数据集和采样器组合在一起,返回数据集的可迭代对象。

  1. 遍历数据
  2. [可选] 可视化数据

参考链接

写本文时参考以下链接:

攻略

新手如何入门pytorch? - 灰灰的回答 - 知乎

#todo: 带你少走弯路:强烈推荐的Pytorch快速入门资料和翻译(可下载)
#todo: 深度学习入门之 PyTorch

官方文档

WELCOME TO PYTORCH TUTORIALS
PyTorch中文文档