欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

nmt Neural Machine Translation (seq2seq)

程序员文章站 2022-06-12 07:51:25
...

【写在前面】建议看原文档。本文只是作者自己的笔记。

https://github.com/tensorflow/nmt

2014年的论文

机器翻译

1. 安装TensorFlow

2. 下载源码,

git clone https://github.com/tensorflow/nmt/

3. 下载数据

We will use a small-scale parallel corpus of TED talks (133K training examples) for this exercise

nmt/scripts/download_iwslt15.sh /tmp/nmt_data

完整的数据集:https://nlp.stanford.edu/projects/nmt/

4. 开始训练

mkdir /tmp/nmt_model
python -m nmt.nmt \
    --src=vi --tgt=en \
    --vocab_prefix=/tmp/nmt_data/vocab  \
    --train_prefix=/tmp/nmt_data/train \
    --dev_prefix=/tmp/nmt_data/tst2012  \
    --test_prefix=/tmp/nmt_data/tst2013 \
    --out_dir=/tmp/nmt_model \
    --num_train_steps=12000 \
    --steps_per_stats=100 \
    --num_layers=2 \
    --num_units=128 \
    --dropout=0.2 \
    --metrics=bleu

在README.md同目录,训练脚本