Two RNNs are packed together to form an encoder-decoder RNN network. The decoder emits logits, which are greedily transformed into words of the target language. As an example, an automatic translation from Vietnamese into English is shown here:
- Input sentence in Vietnamese: Khi tôi còn nhỏ , Tôi nghĩ rằng BắcTriều Tiên là đất nước tốt nhất trên thế giới và tôi thường hát bài " Chúng ta chẳng có gì phải ghen tị.
- Output sentence translated into English: When I'm a very good , I'm going to see the most important thing about the most important and I'm not sure what I'm going to say.