欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

pytorch中lstm学习

程序员文章站 2022-03-16 17:18:22
...

学习资料:

pytorch-doc-zh/nlp_sequence_models_tutorial.md at master · apachecn/pytorch-doc-zh · GitHub


if __name__ == '__main__':
    import torch

    import torch.nn as nn  # 神经网络模块

    rnn = nn.LSTM(10, 20, 2)

    # 输入数据x的向量维数10, 设定lstm隐藏层的特征维度20, 此model用2个lstm层。如果是1,可以省略,默认为1)

    input = torch.randn(5, 3, 10)

    # 输入的input为,序列长度seq_len=5, 每次取的minibatch大小,batch_size=3, 数据向量维数=10(仍然为x的维度)。每次运行时取3个含有5个字的句子(且句子中每个字的维度为10进行运行)

    # 初始化的隐藏元和记忆元,通常它们的维度是一样的

    # 2个LSTM层,batch_size=3, 隐藏层的特征维度20

    h0 = torch.randn(2, 3, 20)

    c0 = torch.randn(2, 3, 20)

    # 这里有2层lstm,output是最后一层lstm的每个词向量对应隐藏层的输出,其与层数无关,只与序列长度相关

    # hn,cn是所有层最后一个隐藏元和记忆元的输出

    output, (hn, cn) = rnn(input, (h0, c0))

    ##模型的三个输入与三个输出。三个输入与输出的理解见上三输入,三输出

    print(output.size(), hn.size(), cn.size())