TASK	DATASET	MODEL	METRIC NAME	METRIC VALUE	GLOBAL RANK
Part-Of-Speech Tagging	ARK	ACE	Acc	94.4	# 1
Chunking	CoNLL 2000	ACE	Exact Span F1	97.3	# 1
Named Entity Recognition (NER)	CoNLL 2002 (Dutch)	ACE	F1	94.6	# 3
Named Entity Recognition (NER)	CoNLL 2002 (Dutch)	ACE + document-context	F1	95.7	# 1
Named Entity Recognition (NER)	CoNLL 2002 (Spanish)	ACE + document-context	F1	95.9	# 1
Named Entity Recognition (NER)	CoNLL 2002 (Spanish)	ACE	F1	91.7	# 2
Named Entity Recognition (NER)	CoNLL 2003 (English)	ACE	F1	93.64	# 13
Named Entity Recognition (NER)	CoNLL 2003 (English)	ACE + document-context	F1	94.6	# 1
Chunking	CoNLL 2003 (English)	ACE	F1	92.5	# 1
Named Entity Recognition (NER)	CoNLL 2003 (German)	ACE + document-context	F1	88.38	# 1
Named Entity Recognition (NER)	CoNLL 2003 (German)	ACE	F1	87.0	# 4
Chunking	CoNLL 2003 (German)	ACE	F1	95.0	# 1
Named Entity Recognition (NER)	CoNLL 2003 (German) Revised	ACE	F1	90.5	# 3
Named Entity Recognition (NER)	CoNLL 2003 (German) Revised	ACE + document-context	F1	91.7	# 2
Semantic Dependency Parsing	DM	ACE	In-domain	95.6	# 1
Semantic Dependency Parsing	DM	ACE	Out-of-domain	92.6	# 1
Semantic Dependency Parsing	PAS	ACE	In-domain	95.8	# 1
Semantic Dependency Parsing	PAS	ACE	Out-of-domain	94.6	# 1
Chunking	Penn Treebank	ACE	F1 score	97.3	# 1
Dependency Parsing	Penn Treebank	ACE	UAS	97.2	# 4
Dependency Parsing	Penn Treebank	ACE	LAS	95.8	# 3
Semantic Dependency Parsing	PSD	ACE	In-domain	83.8	# 1
Semantic Dependency Parsing	PSD	ACE	Out-of-domain	83.4	# 1
Part-Of-Speech Tagging	Ritter	ACE	Acc	93.4	# 1
Aspect Extraction	SemEval-2014 Task-4	ACE	Laptop (F1)	87.4	# 2
Aspect Extraction	SemEval-2014 Task-4	ACE	Restaurant (F1)	92.0	# 2
Aspect Extraction	SemEval 2015 Task 12	ACE	Restaurant (F1)	80.3	# 1
Part-Of-Speech Tagging	Tweebank	ACE	Acc	95.8	# 1

Badge	Markdown
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/automated-concatenation-of-embeddings-for-1/part-of-speech-tagging-on-ark)](https://paperswithcode.com/sota/part-of-speech-tagging-on-ark?p=automated-concatenation-of-embeddings-for-1)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/automated-concatenation-of-embeddings-for-1/chunking-on-conll-2000)](https://paperswithcode.com/sota/chunking-on-conll-2000?p=automated-concatenation-of-embeddings-for-1)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/automated-concatenation-of-embeddings-for-1/named-entity-recognition-on-conll-2002-dutch)](https://paperswithcode.com/sota/named-entity-recognition-on-conll-2002-dutch?p=automated-concatenation-of-embeddings-for-1)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/automated-concatenation-of-embeddings-for-1/named-entity-recognition-on-conll-2002)](https://paperswithcode.com/sota/named-entity-recognition-on-conll-2002?p=automated-concatenation-of-embeddings-for-1)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/automated-concatenation-of-embeddings-for-1/named-entity-recognition-ner-on-conll-2003)](https://paperswithcode.com/sota/named-entity-recognition-ner-on-conll-2003?p=automated-concatenation-of-embeddings-for-1)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/automated-concatenation-of-embeddings-for-1/chunking-on-conll-2003-english)](https://paperswithcode.com/sota/chunking-on-conll-2003-english?p=automated-concatenation-of-embeddings-for-1)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/automated-concatenation-of-embeddings-for-1/named-entity-recognition-on-conll-2003-german)](https://paperswithcode.com/sota/named-entity-recognition-on-conll-2003-german?p=automated-concatenation-of-embeddings-for-1)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/automated-concatenation-of-embeddings-for-1/chunking-on-conll-2003-german)](https://paperswithcode.com/sota/chunking-on-conll-2003-german?p=automated-concatenation-of-embeddings-for-1)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/automated-concatenation-of-embeddings-for-1/semantic-dependency-parsing-on-dm)](https://paperswithcode.com/sota/semantic-dependency-parsing-on-dm?p=automated-concatenation-of-embeddings-for-1)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/automated-concatenation-of-embeddings-for-1/semantic-dependency-parsing-on-pas)](https://paperswithcode.com/sota/semantic-dependency-parsing-on-pas?p=automated-concatenation-of-embeddings-for-1)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/automated-concatenation-of-embeddings-for-1/chunking-on-penn-treebank)](https://paperswithcode.com/sota/chunking-on-penn-treebank?p=automated-concatenation-of-embeddings-for-1)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/automated-concatenation-of-embeddings-for-1/semantic-dependency-parsing-on-psd)](https://paperswithcode.com/sota/semantic-dependency-parsing-on-psd?p=automated-concatenation-of-embeddings-for-1)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/automated-concatenation-of-embeddings-for-1/part-of-speech-tagging-on-ritter)](https://paperswithcode.com/sota/part-of-speech-tagging-on-ritter?p=automated-concatenation-of-embeddings-for-1)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/automated-concatenation-of-embeddings-for-1/aspect-extraction-on-semeval-2015-task-12)](https://paperswithcode.com/sota/aspect-extraction-on-semeval-2015-task-12?p=automated-concatenation-of-embeddings-for-1)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/automated-concatenation-of-embeddings-for-1/part-of-speech-tagging-on-tweebank)](https://paperswithcode.com/sota/part-of-speech-tagging-on-tweebank?p=automated-concatenation-of-embeddings-for-1)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/automated-concatenation-of-embeddings-for-1/named-entity-recognition-on-conll-2003-german-1)](https://paperswithcode.com/sota/named-entity-recognition-on-conll-2003-german-1?p=automated-concatenation-of-embeddings-for-1)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/automated-concatenation-of-embeddings-for-1/aspect-extraction-on-semeval-2014-task-4-sub-1)](https://paperswithcode.com/sota/aspect-extraction-on-semeval-2014-task-4-sub-1?p=automated-concatenation-of-embeddings-for-1)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/automated-concatenation-of-embeddings-for-1/dependency-parsing-on-penn-treebank)](https://paperswithcode.com/sota/dependency-parsing-on-penn-treebank?p=automated-concatenation-of-embeddings-for-1)`

Automated Concatenation of Embeddings for Structured Prediction

ACL 2021 · Xinyu Wang, Yong Jiang, Nguyen Bach, Tao Wang, Zhongqiang Huang, Fei Huang, Kewei Tu ·

Pretrained contextualized embeddings are powerful word representations for structured prediction tasks. Recent work found that better word representations can be obtained by concatenating different types of embeddings. However, the selection of embeddings to form the best concatenated representation usually varies depending on the task and the collection of candidate embeddings, and the ever-increasing number of embedding types makes it a more difficult problem. In this paper, we propose Automated Concatenation of Embeddings (ACE) to automate the process of finding better concatenations of embeddings for structured prediction tasks, based on a formulation inspired by recent progress on neural architecture search. Specifically, a controller alternately samples a concatenation of embeddings, according to its current belief of the effectiveness of individual embedding types in consideration for a task, and updates the belief based on a reward. We follow strategies in reinforcement learning to optimize the parameters of the controller and compute the reward based on the accuracy of a task model, which is fed with the sampled concatenation as input and trained on a task dataset. Empirical results on 6 tasks and 21 datasets show that our approach outperforms strong baselines and achieves state-of-the-art performance with fine-tuned embeddings in all the evaluations.

PDF Abstract ACL 2021 PDF ACL 2021 Abstract

Code

Add Remove Mark official

Alibaba-NLP/ACE official

289

zhaoyuesun/phee

Tasks

Add Remove

Aspect Extraction

Chunking

Dependency Parsing

Named Entity Recognition (NER)

Neural Architecture Search

Part-Of-Speech Tagging

Semantic Dependency Parsing

Structured Prediction

Datasets

Penn Treebank CoNLL 2003 CoNLL SemEval-2014 Task-4

CoNLL 2002 Tweebank CoNLL-2000 Temp3

Results from the Paper

Edit

Ranked #1 on Chunking on Penn Treebank

Get a GitHub badge

Task	Dataset	Model	Metric Name	Metric Value	Global Rank	Benchmark
Part-Of-Speech Tagging	ARK	ACE	Acc	94.4	# 1	Compare
Chunking	CoNLL 2000	ACE	Exact Span F1	97.3	# 1	Compare
Named Entity Recognition (NER)	CoNLL 2002 (Dutch)	ACE	F1	94.6	# 3	Compare
Named Entity Recognition (NER)	CoNLL 2002 (Dutch)	ACE + document-context	F1	95.7	# 1	Compare
Named Entity Recognition (NER)	CoNLL 2002 (Spanish)	ACE + document-context	F1	95.9	# 1	Compare
Named Entity Recognition (NER)	CoNLL 2002 (Spanish)	ACE	F1	91.7	# 2	Compare
Named Entity Recognition (NER)	CoNLL 2003 (English)	ACE	F1	93.64	# 13	Compare
Named Entity Recognition (NER)	CoNLL 2003 (English)	ACE + document-context	F1	94.6	# 1	Compare
Chunking	CoNLL 2003 (English)	ACE	F1	92.5	# 1	Compare
Named Entity Recognition (NER)	CoNLL 2003 (German)	ACE + document-context	F1	88.38	# 1	Compare
Named Entity Recognition (NER)	CoNLL 2003 (German)	ACE	F1	87.0	# 4	Compare
Chunking	CoNLL 2003 (German)	ACE	F1	95.0	# 1	Compare
Named Entity Recognition (NER)	CoNLL 2003 (German) Revised	ACE	F1	90.5	# 3	Compare
Named Entity Recognition (NER)	CoNLL 2003 (German) Revised	ACE + document-context	F1	91.7	# 2	Compare
Semantic Dependency Parsing	DM	ACE	In-domain	95.6	# 1	Compare
Semantic Dependency Parsing	DM	ACE	Out-of-domain	92.6	# 1	Compare
Semantic Dependency Parsing	PAS	ACE	In-domain	95.8	# 1	Compare
Semantic Dependency Parsing	PAS	ACE	Out-of-domain	94.6	# 1	Compare
Chunking	Penn Treebank	ACE	F1 score	97.3	# 1	Compare
Dependency Parsing	Penn Treebank	ACE	UAS	97.2	# 4	Compare
Dependency Parsing	Penn Treebank	ACE	LAS	95.8	# 3	Compare
Semantic Dependency Parsing	PSD	ACE	In-domain	83.8	# 1	Compare
Semantic Dependency Parsing	PSD	ACE	Out-of-domain	83.4	# 1	Compare
Part-Of-Speech Tagging	Ritter	ACE	Acc	93.4	# 1	Compare
Aspect Extraction	SemEval-2014 Task-4	ACE	Laptop (F1)	87.4	# 2	Compare
Aspect Extraction	SemEval-2014 Task-4	ACE	Restaurant (F1)	92.0	# 2	Compare
Aspect Extraction	SemEval 2015 Task 12	ACE	Restaurant (F1)	80.3	# 1	Compare
Part-Of-Speech Tagging	Tweebank	ACE	Acc	95.8	# 1	Compare

Methods

Add Remove

Adam • Attention Dropout • BERT • BPE • CRF • Dense Connections • Dropout • Entropy Regularization • GELU • Layer Normalization • Linear Layer • Linear Warmup With Linear Decay • LSTM • Multi-Head Attention • Neural Architecture Search • PPO • Residual Connection • Scaled Dot-Product Attention • SentencePiece • Sigmoid Activation • Softmax • Tanh Activation • Weight Decay • WordPiece • XLNet

Edit Social Preview

Automated Concatenation of Embeddings for Structured Prediction

Code Edit Add Remove Mark official

Tasks Edit Add Remove

Datasets Edit

Results from the Paper Edit

Methods Edit Add Remove

Code

Add Remove Mark official

Tasks

Add Remove

Datasets

Results from the Paper

Edit

Methods

Add Remove