TASK	DATASET	MODEL	METRIC NAME	METRIC VALUE	GLOBAL RANK
Named Entity Recognition (NER)	BC2GM	BioLinkBERT (large)	F1	85.18	# 8
Named Entity Recognition (NER)	BC5CDR	BioLinkBERT (large)	F1	90.22	# 6
Named Entity Recognition (NER)	BC5CDR-chemical	BioLinkBERT (large)	F1	94.04	# 9
Named Entity Recognition (NER)	BC5CDR-disease	BioLinkBERT (large)	F1	86.39	# 5
Question Answering	BioASQ	BioLinkBERT (large)	Accuracy	94.8	# 1
Question Answering	BioASQ	BioLinkBERT (base)	Accuracy	91.4	# 3
Sentence Similarity	BIOSSES	BioLinkBERT (base)	Pearson Correlation	93.25	# 2
Semantic Similarity	BIOSSES	BioLinkBERT (large)	Pearson Correlation	0.9363	# 1
Semantic Similarity	BIOSSES	BioLinkBERT (base)	Pearson Correlation	0.9325	# 2
Sentence Similarity	BIOSSES	BioLinkBERT (large)	Pearson Correlation	93.63	# 1
Text Classification	BLURB	BioLinkBERT (base)	F1	84.35	# 2
Question Answering	BLURB	BioLinkBERT (large)	Accuracy	83.5	# 1
Text Classification	BLURB	BioLinkBERT (large)	F1	84.88	# 1
Question Answering	BLURB	BioLinkBERT (base)	Accuracy	80.81	# 2
Relation Extraction	ChemProt	BioLinkBERT (large)	F1	79.98	# 3
Relation Extraction	ChemProt	BioLinkBERT (large)	Micro F1	79.98	# 1
Relation Extraction	DDI	BioLinkBERT (large)	Micro F1	83.35	# 1
Relation Extraction	DDI	BioLinkBERT (large)	F1	83.35	# 1
Medical Relation Extraction	DDI extraction 2013 corpus	BioLinkBERT (large)	F1	83.35	# 1
PICO	EBM PICO	BioLinkBERT (large)	Macro F1 word level	74.19	# 1
PICO	EBM PICO	BioLinkBERT (base)	Macro F1 word level	73.97	# 2
Relation Extraction	GAD	BioLinkBERT (large)	Micro F1	84.90	# 1
Relation Extraction	GAD	BioLinkBERT (large)	F1	84.90	# 1
Document Classification	HOC	BioLinkBERT (large)	F1	88.1	# 1
Document Classification	HOC	BioLinkBERT (large)	Micro F1	84.87	# 2
Named Entity Recognition (NER)	JNLPBA	BioLinkBERT (large)	F1	80.06	# 6
Question Answering	MedQA	BioLinkBERT (base)	Accuracy	40.0	# 16
Question Answering	MRQA	LinkBERT (large)	Average F1	81.0	# 1
Named Entity Recognition (NER)	NCBI-disease	BioLinkBERT (large)	F1	88.76	# 12
Question Answering	NewsQA	LinkBERT (large)	F1	72.6	# 2
Question Answering	PubMedQA	BioLinkBERT (large)	Accuracy	72.2	# 17
Question Answering	PubMedQA	BioLinkBERT (base)	Accuracy	70.2	# 18
Question Answering	SQuAD1.1	LinkBERT (large)	EM	87.45	# 16
Question Answering	SQuAD1.1	LinkBERT (large)	F1	92.7	# 19
Question Answering	TriviaQA	LinkBERT (large)	F1	78.2	# 3

Badge	Markdown
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/linkbert-pretraining-language-models-with/question-answering-on-bioasq)](https://paperswithcode.com/sota/question-answering-on-bioasq?p=linkbert-pretraining-language-models-with)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/linkbert-pretraining-language-models-with/semantic-similarity-on-biosses)](https://paperswithcode.com/sota/semantic-similarity-on-biosses?p=linkbert-pretraining-language-models-with)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/linkbert-pretraining-language-models-with/sentence-similarity-on-biosses)](https://paperswithcode.com/sota/sentence-similarity-on-biosses?p=linkbert-pretraining-language-models-with)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/linkbert-pretraining-language-models-with/question-answering-on-blurb)](https://paperswithcode.com/sota/question-answering-on-blurb?p=linkbert-pretraining-language-models-with)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/linkbert-pretraining-language-models-with/text-classification-on-blurb)](https://paperswithcode.com/sota/text-classification-on-blurb?p=linkbert-pretraining-language-models-with)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/linkbert-pretraining-language-models-with/relation-extraction-on-ddi)](https://paperswithcode.com/sota/relation-extraction-on-ddi?p=linkbert-pretraining-language-models-with)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/linkbert-pretraining-language-models-with/medical-relation-extraction-on-ddi-extraction)](https://paperswithcode.com/sota/medical-relation-extraction-on-ddi-extraction?p=linkbert-pretraining-language-models-with)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/linkbert-pretraining-language-models-with/pico-on-ebm-pico)](https://paperswithcode.com/sota/pico-on-ebm-pico?p=linkbert-pretraining-language-models-with)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/linkbert-pretraining-language-models-with/relation-extraction-on-gad)](https://paperswithcode.com/sota/relation-extraction-on-gad?p=linkbert-pretraining-language-models-with)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/linkbert-pretraining-language-models-with/document-classification-on-hoc)](https://paperswithcode.com/sota/document-classification-on-hoc?p=linkbert-pretraining-language-models-with)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/linkbert-pretraining-language-models-with/question-answering-on-mrqa-2019)](https://paperswithcode.com/sota/question-answering-on-mrqa-2019?p=linkbert-pretraining-language-models-with)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/linkbert-pretraining-language-models-with/question-answering-on-newsqa)](https://paperswithcode.com/sota/question-answering-on-newsqa?p=linkbert-pretraining-language-models-with)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/linkbert-pretraining-language-models-with/relation-extraction-on-chemprot)](https://paperswithcode.com/sota/relation-extraction-on-chemprot?p=linkbert-pretraining-language-models-with)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/linkbert-pretraining-language-models-with/question-answering-on-triviaqa)](https://paperswithcode.com/sota/question-answering-on-triviaqa?p=linkbert-pretraining-language-models-with)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/linkbert-pretraining-language-models-with/named-entity-recognition-on-bc5cdr-disease)](https://paperswithcode.com/sota/named-entity-recognition-on-bc5cdr-disease?p=linkbert-pretraining-language-models-with)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/linkbert-pretraining-language-models-with/named-entity-recognition-ner-on-bc5cdr)](https://paperswithcode.com/sota/named-entity-recognition-ner-on-bc5cdr?p=linkbert-pretraining-language-models-with)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/linkbert-pretraining-language-models-with/named-entity-recognition-ner-on-jnlpba)](https://paperswithcode.com/sota/named-entity-recognition-ner-on-jnlpba?p=linkbert-pretraining-language-models-with)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/linkbert-pretraining-language-models-with/named-entity-recognition-on-bc2gm)](https://paperswithcode.com/sota/named-entity-recognition-on-bc2gm?p=linkbert-pretraining-language-models-with)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/linkbert-pretraining-language-models-with/named-entity-recognition-on-bc5cdr-chemical)](https://paperswithcode.com/sota/named-entity-recognition-on-bc5cdr-chemical?p=linkbert-pretraining-language-models-with)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/linkbert-pretraining-language-models-with/named-entity-recognition-ner-on-ncbi-disease)](https://paperswithcode.com/sota/named-entity-recognition-ner-on-ncbi-disease?p=linkbert-pretraining-language-models-with)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/linkbert-pretraining-language-models-with/question-answering-on-medqa-usmle)](https://paperswithcode.com/sota/question-answering-on-medqa-usmle?p=linkbert-pretraining-language-models-with)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/linkbert-pretraining-language-models-with/question-answering-on-squad11)](https://paperswithcode.com/sota/question-answering-on-squad11?p=linkbert-pretraining-language-models-with)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/linkbert-pretraining-language-models-with/question-answering-on-pubmedqa)](https://paperswithcode.com/sota/question-answering-on-pubmedqa?p=linkbert-pretraining-language-models-with)`

LinkBERT: Pretraining Language Models with Document Links

ACL 2022 · Michihiro Yasunaga, Jure Leskovec, Percy Liang ·

Language model (LM) pretraining can learn various knowledge from text corpora, helping downstream tasks. However, existing methods such as BERT model a single document, and do not capture dependencies or knowledge that span across documents. In this work, we propose LinkBERT, an LM pretraining method that leverages links between documents, e.g., hyperlinks. Given a text corpus, we view it as a graph of documents and create LM inputs by placing linked documents in the same context. We then pretrain the LM with two joint self-supervised objectives: masked language modeling and our new proposal, document relation prediction. We show that LinkBERT outperforms BERT on various downstream tasks across two domains: the general domain (pretrained on Wikipedia with hyperlinks) and biomedical domain (pretrained on PubMed with citation links). LinkBERT is especially effective for multi-hop reasoning and few-shot QA (+5% absolute improvement on HotpotQA and TriviaQA), and our biomedical LinkBERT sets new states of the art on various BioNLP tasks (+7% on BioASQ and USMLE). We release our pretrained models, LinkBERT and BioLinkBERT, as well as code and data at https://github.com/michiyasunaga/LinkBERT.

PDF Abstract ACL 2022 PDF ACL 2022 Abstract

Code

Add Remove Mark official

michiyasunaga/LinkBERT official

394

Tasks

Add Remove

Document Classification

Language Modelling

Masked Language Modeling

Medical Relation Extraction

Named Entity Recognition (NER)

PICO

Question Answering

Relation Extraction

Semantic Similarity

Sentence Similarity

Text Classification

TriviaQA

Datasets

GLUE

SQuAD

Natural Questions

MMLU

TriviaQA

HotpotQA

BookCorpus

NewsQA

BC5CDR

BioASQ

PubMedQA NCBI Disease

MedQA

SearchQA

MRQA

DDI

BIOSSES

BLURB

HOC JNLPBA ChemProt BC2GM GAD

Results from the Paper

Edit

Ranked #1 on Semantic Similarity on BIOSSES

Get a GitHub badge

Task	Dataset	Model	Metric Name	Metric Value	Global Rank	Benchmark
Named Entity Recognition (NER)	BC2GM	BioLinkBERT (large)	F1	85.18	# 8	Compare
Named Entity Recognition (NER)	BC5CDR	BioLinkBERT (large)	F1	90.22	# 6	Compare
Named Entity Recognition (NER)	BC5CDR-chemical	BioLinkBERT (large)	F1	94.04	# 9	Compare
Named Entity Recognition (NER)	BC5CDR-disease	BioLinkBERT (large)	F1	86.39	# 5	Compare
Question Answering	BioASQ	BioLinkBERT (large)	Accuracy	94.8	# 1	Compare
Question Answering	BioASQ	BioLinkBERT (base)	Accuracy	91.4	# 3	Compare
Sentence Similarity	BIOSSES	BioLinkBERT (base)	Pearson Correlation	93.25	# 2	Compare
Semantic Similarity	BIOSSES	BioLinkBERT (large)	Pearson Correlation	0.9363	# 1	Compare
Semantic Similarity	BIOSSES	BioLinkBERT (base)	Pearson Correlation	0.9325	# 2	Compare
Sentence Similarity	BIOSSES	BioLinkBERT (large)	Pearson Correlation	93.63	# 1	Compare
Text Classification	BLURB	BioLinkBERT (base)	F1	84.35	# 2	Compare
Question Answering	BLURB	BioLinkBERT (large)	Accuracy	83.5	# 1	Compare
Text Classification	BLURB	BioLinkBERT (large)	F1	84.88	# 1	Compare
Question Answering	BLURB	BioLinkBERT (base)	Accuracy	80.81	# 2	Compare
Relation Extraction	ChemProt	BioLinkBERT (large)	F1	79.98	# 3	Compare
Relation Extraction	ChemProt	BioLinkBERT (large)	Micro F1	79.98	# 1	Compare
Relation Extraction	DDI	BioLinkBERT (large)	Micro F1	83.35	# 1	Compare
Relation Extraction	DDI	BioLinkBERT (large)	F1	83.35	# 1	Compare
Medical Relation Extraction	DDI extraction 2013 corpus	BioLinkBERT (large)	F1	83.35	# 1	Compare
PICO	EBM PICO	BioLinkBERT (large)	Macro F1 word level	74.19	# 1	Compare
PICO	EBM PICO	BioLinkBERT (base)	Macro F1 word level	73.97	# 2	Compare
Relation Extraction	GAD	BioLinkBERT (large)	Micro F1	84.90	# 1	Compare
Relation Extraction	GAD	BioLinkBERT (large)	F1	84.90	# 1	Compare
Document Classification	HOC	BioLinkBERT (large)	F1	88.1	# 1	Compare
Document Classification	HOC	BioLinkBERT (large)	Micro F1	84.87	# 2	Compare
Named Entity Recognition (NER)	JNLPBA	BioLinkBERT (large)	F1	80.06	# 6	Compare
Question Answering	MedQA	BioLinkBERT (base)	Accuracy	40.0	# 16	Compare
Question Answering	MRQA	LinkBERT (large)	Average F1	81.0	# 1	Compare
Named Entity Recognition (NER)	NCBI-disease	BioLinkBERT (large)	F1	88.76	# 12	Compare
Question Answering	NewsQA	LinkBERT (large)	F1	72.6	# 2	Compare
Question Answering	PubMedQA	BioLinkBERT (large)	Accuracy	72.2	# 17	Compare
Question Answering	PubMedQA	BioLinkBERT (base)	Accuracy	70.2	# 18	Compare
Question Answering	SQuAD1.1	LinkBERT (large)	EM	87.45	# 16	Compare
Question Answering	SQuAD1.1	LinkBERT (large)	F1	92.7	# 19	Compare
Question Answering	TriviaQA	LinkBERT (large)	F1	78.2	# 3	Compare

Methods

Add Remove

Absolute Position Encodings • Adam • Attention Dropout • BERT • BPE • Dense Connections • Dropout • GELU • Label Smoothing • Layer Normalization • Linear Layer • Linear Warmup With Linear Decay • Multi-Head Attention • Position-Wise Feed-Forward Layer • Residual Connection • Scaled Dot-Product Attention • Softmax • Transformer • Weight Decay • WordPiece

Edit Social Preview

LinkBERT: Pretraining Language Models with Document Links

Code Edit Add Remove Mark official

Tasks Edit Add Remove

Datasets Edit

Results from the Paper Edit

Methods Edit Add Remove

Code

Add Remove Mark official

Tasks

Add Remove

Datasets

Results from the Paper

Edit

Methods

Add Remove