TASK	DATASET	MODEL	METRIC NAME	METRIC VALUE	GLOBAL RANK	REMOVE
Multimodal Machine Translation	Multi30K	Multimodal Transformer	BLEU (EN-DE)	38.7	# 6
Multimodal Machine Translation	Multi30K	Multimodal Transformer	Meteor (EN-DE)	55.7	# 6

Badge	Markdown
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/multimodal-transformer-for-multimodal-machine/multimodal-machine-translation-on-multi30k)](https://paperswithcode.com/sota/multimodal-machine-translation-on-multi30k?p=multimodal-transformer-for-multimodal-machine)`

Multimodal Transformer for Multimodal Machine Translation

ACL 2020 · Shaowei Yao, Xiaojun Wan ·

Multimodal Machine Translation (MMT) aims to introduce information from other modality, generally static images, to improve the translation quality. Previous works propose various incorporation methods, but most of them do not consider the relative importance of multiple modalities. Equally treating all modalities may encode too much useless information from less important modalities. In this paper, we introduce the multimodal self-attention in Transformer to solve the issues above in MMT. The proposed method learns the representation of images based on the text, which avoids encoding irrelevant information in images. Experiments and visualization analysis demonstrate that our model benefits from visual information and substantially outperforms previous works and competitive baselines in terms of various metrics.

PDF Abstract

Code

Add Remove Mark official

QAQ-v/MMT

Tasks

Add Remove

Machine Translation

Multimodal Machine Translation

Translation

Datasets

Multi30K

Multi30k

Results from the Paper

Add Remove

Ranked #6 on Multimodal Machine Translation on Multi30K

Get a GitHub badge

Task	Dataset	Model	Metric Name	Metric Value	Global Rank	Benchmark
Multimodal Machine Translation	Multi30K	Multimodal Transformer	BLEU (EN-DE)	38.7	# 6	Compare
Multimodal Machine Translation	Multi30K	Multimodal Transformer	Meteor (EN-DE)	55.7	# 6	Compare

Methods

Add Remove

1x1 Convolution • Absolute Position Encodings • Adam • Average Pooling • Batch Normalization • Bottleneck Residual Block • BPE • Convolution • Dense Connections • Dropout • Global Average Pooling • GloVe • Kaiming Initialization • Label Smoothing • Layer Normalization • Linear Layer • Max Pooling • Multi-Head Attention • Position-Wise Feed-Forward Layer • ReLU • Residual Block • Residual Connection • ResNet • Scaled Dot-Product Attention • Softmax • Transformer

Edit Social Preview

Multimodal Transformer for Multimodal Machine Translation

Code Edit Add Remove Mark official

Tasks Edit Add Remove

Datasets Edit

Results from the Paper Edit Add Remove

Methods Edit Add Remove

Code

Add Remove Mark official

Tasks

Add Remove

Datasets

Results from the Paper

Add Remove

Methods

Add Remove