TASK	DATASET	MODEL	METRIC NAME	METRIC VALUE	GLOBAL RANK
Visual Dialog	BlendedSkillTalk	Multi-Modal BlenderBot	F1	17.8	# 1
Visual Dialog	BlendedSkillTalk	Multi-Modal BlenderBot	BLEU-4	1	# 1
Visual Dialog	BlendedSkillTalk	Multi-Modal BlenderBot	ROUGE-L	19.3	# 1
Visual Dialog	ConvAI2	Multi-Modal BlenderBot	F1	18.4	# 1
Visual Dialog	ConvAI2	Multi-Modal BlenderBot	BLEU-4	1.1	# 1
Visual Dialog	ConvAI2	Multi-Modal BlenderBot	ROUGE-L	22.6	# 1
Visual Dialog	EmpatheticDialogues	Multi-Modal BlenderBot	F1	19.2	# 1
Visual Dialog	EmpatheticDialogues	Multi-Modal BlenderBot	BLEU-4	1.5	# 1
Visual Dialog	EmpatheticDialogues	Multi-Modal BlenderBot	ROUGE-L	24.5	# 1
Visual Dialog	Image-Chat	Multi-Modal BlenderBot	F1	13.1	# 1
Visual Dialog	Image-Chat	Multi-Modal BlenderBot	BLEU-4	40	# 1
Visual Dialog	Image-Chat	Multi-Modal BlenderBot	ROUGE-L	18	# 1
Visual Dialog	Wizard of Wikipedia	Multi-Modal BlenderBot	F1	18.6	# 1
Visual Dialog	Wizard of Wikipedia	Multi-Modal BlenderBot	BLEU-4	2.2	# 1
Visual Dialog	Wizard of Wikipedia	Multi-Modal BlenderBot	ROUGE-L	17.4	# 1

Badge	Markdown
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/multi-modal-open-domain-dialogue/visual-dialog-on-blendedskilltalk)](https://paperswithcode.com/sota/visual-dialog-on-blendedskilltalk?p=multi-modal-open-domain-dialogue)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/multi-modal-open-domain-dialogue/visual-dialog-on-convai2)](https://paperswithcode.com/sota/visual-dialog-on-convai2?p=multi-modal-open-domain-dialogue)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/multi-modal-open-domain-dialogue/visual-dialog-on-empatheticdialogues)](https://paperswithcode.com/sota/visual-dialog-on-empatheticdialogues?p=multi-modal-open-domain-dialogue)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/multi-modal-open-domain-dialogue/visual-dialog-on-image-chat)](https://paperswithcode.com/sota/visual-dialog-on-image-chat?p=multi-modal-open-domain-dialogue)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/multi-modal-open-domain-dialogue/visual-dialog-on-wizard-of-wikipedia)](https://paperswithcode.com/sota/visual-dialog-on-wizard-of-wikipedia?p=multi-modal-open-domain-dialogue)`

Multi-Modal Open-Domain Dialogue

EMNLP 2021 · Kurt Shuster, Eric Michael Smith, Da Ju, Jason Weston ·

Recent work in open-domain conversational agents has demonstrated that significant improvements in model engagingness and humanness metrics can be achieved via massive scaling in both pre-training data and model size (Adiwardana et al., 2020; Roller et al., 2020). However, if we want to build agents with human-like abilities, we must expand beyond handling just text. A particularly important topic is the ability to see images and communicate about what is perceived. With the goal of engaging humans in multi-modal dialogue, we investigate combining components from state-of-the-art open-domain dialogue agents with those from state-of-the-art vision models. We study incorporating different image fusion schemes and domain-adaptive pre-training and fine-tuning strategies, and show that our best resulting model outperforms strong existing models in multi-modal dialogue while simultaneously performing as well as its predecessor (text-only) BlenderBot (Roller et al., 2020) in text-based conversation. We additionally investigate and incorporate safety components in our final model, and show that such efforts do not diminish model performance with respect to engagingness metrics.

PDF Abstract EMNLP 2021 PDF EMNLP 2021 Abstract

Code

Add Remove Mark official

No code implementations yet. Submit your code now

Tasks

Add Remove

Visual Dialog

Datasets

COCO Captions

Wizard of Wikipedia

ConvAI2

EmpatheticDialogues Blended Skill Talk

Image-Chat

Results from the Paper

Edit

Ranked #1 on Visual Dialog on Wizard of Wikipedia

Get a GitHub badge

Task	Dataset	Model	Metric Name	Metric Value	Global Rank	Benchmark
Visual Dialog	BlendedSkillTalk	Multi-Modal BlenderBot	F1	17.8	# 1	Compare
			BLEU-4	1	# 1	Compare
			ROUGE-L	19.3	# 1	Compare
Visual Dialog	ConvAI2	Multi-Modal BlenderBot	F1	18.4	# 1	Compare
			BLEU-4	1.1	# 1	Compare
			ROUGE-L	22.6	# 1	Compare
Visual Dialog	EmpatheticDialogues	Multi-Modal BlenderBot	F1	19.2	# 1	Compare
			BLEU-4	1.5	# 1	Compare
			ROUGE-L	24.5	# 1	Compare
Visual Dialog	Image-Chat	Multi-Modal BlenderBot	F1	13.1	# 1	Compare
			BLEU-4	40	# 1	Compare
			ROUGE-L	18	# 1	Compare
Visual Dialog	Wizard of Wikipedia	Multi-Modal BlenderBot	F1	18.6	# 1	Compare
			BLEU-4	2.2	# 1	Compare
			ROUGE-L	17.4	# 1	Compare

Methods

Add Remove

No methods listed for this paper. Add relevant methods here

Edit Social Preview

Multi-Modal Open-Domain Dialogue

Code Edit Add Remove Mark official

Tasks Edit Add Remove

Datasets Edit

Results from the Paper Edit

Methods Edit Add Remove

Code

Add Remove Mark official

Tasks

Add Remove

Datasets

Results from the Paper

Edit

Methods

Add Remove