TASK	DATASET	MODEL	METRIC NAME	METRIC VALUE	GLOBAL RANK
Linguistic Acceptability	CoLA	SpanBERT	Accuracy	64.3%	# 25
Semantic Textual Similarity	MRPC	SpanBERT	Accuracy	90.9%	# 8
Natural Language Inference	MultiNLI	SpanBERT	Matched	88.1	# 14
Question Answering	NaturalQA	SpanBERT	F1	82.5	# 1
Question Answering	NewsQA	SpanBERT	F1	73.6	# 1
Coreference Resolution	OntoNotes	SpanBERT	F1	79.6	# 10
Natural Language Inference	QNLI	SpanBERT	Accuracy	94.3%	# 17
Paraphrase Identification	Quora Question Pairs	SpanBERT	Accuracy	89.5	# 9
Paraphrase Identification	Quora Question Pairs	SpanBERT	F1	71.9	# 13
Relation Extraction	Re-TACRED	SpanBERT	F1	85.3	# 5
Natural Language Inference	RTE	SpanBERT	Accuracy	79.0%	# 40
Open-Domain Question Answering	SearchQA	SpanBERT	F1	84.8	# 1
Question Answering	SQuAD1.1	SpanBERT (single model)	EM	88.8	# 13
Question Answering	SQuAD1.1	SpanBERT (single model)	F1	94.6	# 11
Question Answering	SQuAD1.1	SpanBERT (single model)	Hardware Burden	586G	# 1
Question Answering	SQuAD2.0	SpanBERT	EM	85.7	# 120
Question Answering	SQuAD2.0	SpanBERT	F1	88.7	# 118
Question Answering	SQuAD2.0 dev	SpanBERT	F1	86.8	# 6
Sentiment Analysis	SST-2 Binary classification	SpanBERT	Accuracy	94.8	# 28
Semantic Textual Similarity	STS Benchmark	SpanBERT	Pearson Correlation	0.899	# 20
Relation Extraction	TACRED	SpanBERT-large	F1	70.8	# 21
Relation Classification	TACRED	SpanBERT	F1	70.8	# 7
Question Answering	TriviaQA	SpanBERT	F1	83.6	# 1

Badge	Markdown
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/spanbert-improving-pre-training-by/question-answering-on-naturalqa)](https://paperswithcode.com/sota/question-answering-on-naturalqa?p=spanbert-improving-pre-training-by)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/spanbert-improving-pre-training-by/question-answering-on-newsqa)](https://paperswithcode.com/sota/question-answering-on-newsqa?p=spanbert-improving-pre-training-by)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/spanbert-improving-pre-training-by/open-domain-question-answering-on-searchqa)](https://paperswithcode.com/sota/open-domain-question-answering-on-searchqa?p=spanbert-improving-pre-training-by)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/spanbert-improving-pre-training-by/question-answering-on-triviaqa)](https://paperswithcode.com/sota/question-answering-on-triviaqa?p=spanbert-improving-pre-training-by)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/spanbert-improving-pre-training-by/relation-extraction-on-re-tacred)](https://paperswithcode.com/sota/relation-extraction-on-re-tacred?p=spanbert-improving-pre-training-by)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/spanbert-improving-pre-training-by/question-answering-on-squad20-dev)](https://paperswithcode.com/sota/question-answering-on-squad20-dev?p=spanbert-improving-pre-training-by)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/spanbert-improving-pre-training-by/relation-classification-on-tacred-1)](https://paperswithcode.com/sota/relation-classification-on-tacred-1?p=spanbert-improving-pre-training-by)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/spanbert-improving-pre-training-by/semantic-textual-similarity-on-mrpc)](https://paperswithcode.com/sota/semantic-textual-similarity-on-mrpc?p=spanbert-improving-pre-training-by)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/spanbert-improving-pre-training-by/coreference-resolution-on-ontonotes)](https://paperswithcode.com/sota/coreference-resolution-on-ontonotes?p=spanbert-improving-pre-training-by)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/spanbert-improving-pre-training-by/paraphrase-identification-on-quora-question)](https://paperswithcode.com/sota/paraphrase-identification-on-quora-question?p=spanbert-improving-pre-training-by)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/spanbert-improving-pre-training-by/question-answering-on-squad11)](https://paperswithcode.com/sota/question-answering-on-squad11?p=spanbert-improving-pre-training-by)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/spanbert-improving-pre-training-by/natural-language-inference-on-multinli)](https://paperswithcode.com/sota/natural-language-inference-on-multinli?p=spanbert-improving-pre-training-by)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/spanbert-improving-pre-training-by/natural-language-inference-on-qnli)](https://paperswithcode.com/sota/natural-language-inference-on-qnli?p=spanbert-improving-pre-training-by)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/spanbert-improving-pre-training-by/semantic-textual-similarity-on-sts-benchmark)](https://paperswithcode.com/sota/semantic-textual-similarity-on-sts-benchmark?p=spanbert-improving-pre-training-by)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/spanbert-improving-pre-training-by/relation-extraction-on-tacred)](https://paperswithcode.com/sota/relation-extraction-on-tacred?p=spanbert-improving-pre-training-by)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/spanbert-improving-pre-training-by/linguistic-acceptability-on-cola)](https://paperswithcode.com/sota/linguistic-acceptability-on-cola?p=spanbert-improving-pre-training-by)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/spanbert-improving-pre-training-by/sentiment-analysis-on-sst-2-binary)](https://paperswithcode.com/sota/sentiment-analysis-on-sst-2-binary?p=spanbert-improving-pre-training-by)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/spanbert-improving-pre-training-by/natural-language-inference-on-rte)](https://paperswithcode.com/sota/natural-language-inference-on-rte?p=spanbert-improving-pre-training-by)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/spanbert-improving-pre-training-by/question-answering-on-squad20)](https://paperswithcode.com/sota/question-answering-on-squad20?p=spanbert-improving-pre-training-by)`

SpanBERT: Improving Pre-training by Representing and Predicting Spans

TACL 2020 · Mandar Joshi, Danqi Chen, Yinhan Liu, Daniel S. Weld, Luke Zettlemoyer, Omer Levy ·

We present SpanBERT, a pre-training method that is designed to better represent and predict spans of text. Our approach extends BERT by (1) masking contiguous random spans, rather than random tokens, and (2) training the span boundary representations to predict the entire content of the masked span, without relying on the individual token representations within it. SpanBERT consistently outperforms BERT and our better-tuned baselines, with substantial gains on span selection tasks such as question answering and coreference resolution. In particular, with the same training data and model size as BERT-large, our single model obtains 94.6% and 88.7% F1 on SQuAD 1.1 and 2.0, respectively. We also achieve a new state of the art on the OntoNotes coreference resolution task (79.6\% F1), strong performance on the TACRED relation extraction benchmark, and even show gains on GLUE.

PDF Abstract TACL 2020 PDF TACL 2020 Abstract

Code

Add Remove Mark official

facebookresearch/SpanBERT official

874

mandarjoshi90/coref

↳ Quickstart in

Colab

435

zixinzeng-jennifer/spanbert_trans

wooseok-AI/Korean_e2e_CR_BERT

↳ Quickstart in

Colab

amore-upf/masked-coreference

See all 6 implementations

Tasks

Add Remove

Coreference Resolution

Linguistic Acceptability

Natural Language Inference

Open-Domain Question Answering

Paraphrase Identification

Question Answering

Relation Classification

Relation Extraction

Semantic Textual Similarity

Sentiment Analysis

Datasets

GLUE

SST

SQuAD

MultiNLI SST-2

QNLI

Natural Questions

MRPC

TriviaQA

CoLA

HotpotQA

NewsQA OntoNotes 5.0

TACRED

SearchQA

MRQA CoNLL-2012

Quora

Quora Question Pairs RTE Re-TACRED STS Benchmark

Results from the Paper

Edit

Ranked #1 on Question Answering on NewsQA (F1 metric)

Get a GitHub badge

Task	Dataset	Model	Metric Name	Metric Value	Global Rank	Benchmark
Linguistic Acceptability	CoLA	SpanBERT	Accuracy	64.3%	# 25	Compare
Semantic Textual Similarity	MRPC	SpanBERT	Accuracy	90.9%	# 8	Compare
Natural Language Inference	MultiNLI	SpanBERT	Matched	88.1	# 14	Compare
Question Answering	NaturalQA	SpanBERT	F1	82.5	# 1	Compare
Question Answering	NewsQA	SpanBERT	F1	73.6	# 1	Compare
Coreference Resolution	OntoNotes	SpanBERT	F1	79.6	# 10	Compare
Natural Language Inference	QNLI	SpanBERT	Accuracy	94.3%	# 17	Compare
Paraphrase Identification	Quora Question Pairs	SpanBERT	Accuracy	89.5	# 9	Compare
Paraphrase Identification	Quora Question Pairs	SpanBERT	F1	71.9	# 13	Compare
Relation Extraction	Re-TACRED	SpanBERT	F1	85.3	# 5	Compare
Natural Language Inference	RTE	SpanBERT	Accuracy	79.0%	# 40	Compare
Open-Domain Question Answering	SearchQA	SpanBERT	F1	84.8	# 1	Compare
Question Answering	SQuAD1.1	SpanBERT (single model)	EM	88.8	# 13	Compare
			F1	94.6	# 11	Compare
			Hardware Burden	586G	# 1	Compare
Question Answering	SQuAD2.0	SpanBERT	EM	85.7	# 120	Compare
Question Answering	SQuAD2.0	SpanBERT	F1	88.7	# 118	Compare
Question Answering	SQuAD2.0 dev	SpanBERT	F1	86.8	# 6	Compare
Sentiment Analysis	SST-2 Binary classification	SpanBERT	Accuracy	94.8	# 28	Compare
Semantic Textual Similarity	STS Benchmark	SpanBERT	Pearson Correlation	0.899	# 20	Compare
Relation Extraction	TACRED	SpanBERT-large	F1	70.8	# 21	Compare
Relation Classification	TACRED	SpanBERT	F1	70.8	# 7	Compare
Question Answering	TriviaQA	SpanBERT	F1	83.6	# 1	Compare

Methods

Add Remove

Adam • Attention Dropout • BERT • Dense Connections • Dropout • GELU • Layer Normalization • Linear Layer • Linear Warmup With Linear Decay • Multi-Head Attention • Residual Connection • Scaled Dot-Product Attention • Softmax • Weight Decay • WordPiece

Edit Social Preview

SpanBERT: Improving Pre-training by Representing and Predicting Spans

Code Edit Add Remove Mark official

Tasks Edit Add Remove

Datasets Edit

Results from the Paper Edit

Methods Edit Add Remove

Code

Add Remove Mark official

Tasks

Add Remove

Datasets

Results from the Paper

Edit

Methods

Add Remove