TASK	DATASET	MODEL	METRIC NAME	METRIC VALUE	GLOBAL RANK
Emotion Recognition in Conversation	CPED	BERT+AVG+MLP	Accuracy of Sentiment	51.50	# 1
Emotion Recognition in Conversation	CPED	BERT+AVG+MLP	Macro-F1 of Sentiment	48.02	# 1
Personality Recognition in Conversation	CPED	BERT$_{ssenet}^{c}$	Accuracy (%)	67.25	# 1
Personality Recognition in Conversation	CPED	BERT$_{ssenet}^{c}$	Macro-F1	74.08	# 1
Personality Recognition in Conversation	CPED	BERT$_{ssenet}^{c}$	Accuracy of Neurotism	53.27	# 3
Personality Recognition in Conversation	CPED	BERT$_{ssenet}^{c}$	Accuracy of Extraversion	78.21	# 1
Personality Recognition in Conversation	CPED	BERT$_{ssenet}^{c}$	Accuracy of Openness	55.42	# 2
Personality Recognition in Conversation	CPED	BERT$_{ssenet}^{c}$	Accuracy of Agreeableness	85.89	# 1
Personality Recognition in Conversation	CPED	BERT$_{ssenet}^{c}$	Accuracy of Conscientiousness	63.48	# 2
Personality Recognition in Conversation	CPED	BERT$_{senet}^{c}$	Accuracy (%)	66.02	# 4
Personality Recognition in Conversation	CPED	BERT$_{senet}^{c}$	Macro-F1	71.89	# 4
Personality Recognition in Conversation	CPED	BERT$_{senet}^{c}$	Accuracy of Neurotism	53.4	# 2
Personality Recognition in Conversation	CPED	BERT$_{senet}^{c}$	Accuracy of Extraversion	77.71	# 4
Personality Recognition in Conversation	CPED	BERT$_{senet}^{c}$	Accuracy of Openness	55.42	# 2
Personality Recognition in Conversation	CPED	BERT$_{senet}^{c}$	Accuracy of Agreeableness	81.99	# 3
Personality Recognition in Conversation	CPED	BERT$_{senet}^{c}$	Accuracy of Conscientiousness	61.59	# 4
Personality Recognition in Conversation	CPED	BERT$^{c}$	Accuracy (%)	66.32	# 3
Personality Recognition in Conversation	CPED	BERT$^{c}$	Macro-F1	72.69	# 3
Personality Recognition in Conversation	CPED	BERT$^{c}$	Accuracy of Neurotism	55.29	# 1
Personality Recognition in Conversation	CPED	BERT$^{c}$	Accuracy of Extraversion	78.08	# 2
Personality Recognition in Conversation	CPED	BERT$^{c}$	Accuracy of Openness	53.90	# 4
Personality Recognition in Conversation	CPED	BERT$^{c}$	Accuracy of Agreeableness	80.98	# 4
Personality Recognition in Conversation	CPED	BERT$^{c}$	Accuracy of Conscientiousness	63.35	# 3
Personality Recognition in Conversation	CPED	BERT$^{s}$	Accuracy (%)	67.23	# 2
Personality Recognition in Conversation	CPED	BERT$^{s}$	Macro-F1	72.93	# 2
Personality Recognition in Conversation	CPED	BERT$^{s}$	Accuracy of Neurotism	50.75	# 4
Personality Recognition in Conversation	CPED	BERT$^{s}$	Accuracy of Extraversion	78.08	# 2
Personality Recognition in Conversation	CPED	BERT$^{s}$	Accuracy of Openness	57.93	# 1
Personality Recognition in Conversation	CPED	BERT$^{s}$	Accuracy of Agreeableness	85.76	# 2
Personality Recognition in Conversation	CPED	BERT$^{s}$	Accuracy of Conscientiousness	63.60	# 1
Personalized and Emotional Conversation	CPED	GPT-{emo}	PPL	17.48	# 1
Personalized and Emotional Conversation	CPED	GPT-{emo}	BLEU	0.1342	# 5
Personalized and Emotional Conversation	CPED	GPT-{emo}	Distinct-1	0.0614	# 1
Personalized and Emotional Conversation	CPED	GPT-{emo}	Distinct-2	0.3430	# 1
Personalized and Emotional Conversation	CPED	GPT-{emo}	Greedy Embedding	0.4996	# 5
Personalized and Emotional Conversation	CPED	GPT-{emo}	Average Embedding	0.5588	# 5
Personalized and Emotional Conversation	CPED	GPT-{emo}	bertscore	0.5709	# 4
Personalized and Emotional Conversation	CPED	GPT-{per+emo+da}	PPL	17.80	# 4
Personalized and Emotional Conversation	CPED	GPT-{per+emo+da}	BLEU	0.1382	# 2
Personalized and Emotional Conversation	CPED	GPT-{per+emo+da}	Distinct-1	0.0601	# 4
Personalized and Emotional Conversation	CPED	GPT-{per+emo+da}	Distinct-2	0.3404	# 2
Personalized and Emotional Conversation	CPED	GPT-{per+emo+da}	Greedy Embedding	05012	# 1
Personalized and Emotional Conversation	CPED	GPT-{per+emo+da}	Average Embedding	0.5608	# 3
Personalized and Emotional Conversation	CPED	GPT-{per+emo+da}	bertscore	0.5722	# 1
Personalized and Emotional Conversation	CPED	GPT-{per+emo}	PPL	17.70	# 2
Personalized and Emotional Conversation	CPED	GPT-{per+emo}	BLEU	0.1403	# 1
Personalized and Emotional Conversation	CPED	GPT-{per+emo}	Distinct-1	0.0602	# 3
Personalized and Emotional Conversation	CPED	GPT-{per+emo}	Distinct-2	0.3388	# 4
Personalized and Emotional Conversation	CPED	GPT-{per+emo}	Greedy Embedding	0.5026	# 2
Personalized and Emotional Conversation	CPED	GPT-{per+emo}	Average Embedding	0.5617	# 1
Personalized and Emotional Conversation	CPED	GPT-{per+emo}	bertscore	0.5719	# 2
Personalized and Emotional Conversation	CPED	GPT-{da}	PPL	17.72	# 3
Personalized and Emotional Conversation	CPED	GPT-{da}	BLEU	0.1372	# 3
Personalized and Emotional Conversation	CPED	GPT-{da}	Distinct-1	0.0605	# 2
Personalized and Emotional Conversation	CPED	GPT-{da}	Distinct-2	0.3389	# 3
Personalized and Emotional Conversation	CPED	GPT-{da}	Greedy Embedding	0.5017	# 3
Personalized and Emotional Conversation	CPED	GPT-{da}	Average Embedding	0.5610	# 2
Personalized and Emotional Conversation	CPED	GPT-{da}	bertscore	0.5703	# 5
Personalized and Emotional Conversation	CPED	GPT-{per}	PPL	18.08	# 5
Personalized and Emotional Conversation	CPED	GPT-{per}	BLEU	0.1372	# 3
Personalized and Emotional Conversation	CPED	GPT-{per}	Distinct-1	0.0592	# 5
Personalized and Emotional Conversation	CPED	GPT-{per}	Distinct-2	0.3363	# 5
Personalized and Emotional Conversation	CPED	GPT-{per}	Greedy Embedding	0.5009	# 4
Personalized and Emotional Conversation	CPED	GPT-{per}	Average Embedding	0.5606	# 4
Personalized and Emotional Conversation	CPED	GPT-{per}	bertscore	0.5715	# 3
Personalized and Emotional Conversation	CPED	{emo+da}-GPT w/o da	PPL	22.09	# 8
Personalized and Emotional Conversation	CPED	{emo+da}-GPT w/o da	BLEU	0.1272	# 7
Personalized and Emotional Conversation	CPED	{emo+da}-GPT w/o da	Distinct-1	0.0473	# 8
Personalized and Emotional Conversation	CPED	{emo+da}-GPT w/o da	Distinct-2	0.2790	# 6
Personalized and Emotional Conversation	CPED	{emo+da}-GPT w/o da	Greedy Embedding	0.4962	# 7
Personalized and Emotional Conversation	CPED	{emo+da}-GPT w/o da	Average Embedding	0.5556	# 7
Personalized and Emotional Conversation	CPED	{emo+da}-GPT w/o da	bertscore	0.5669	# 7
Personalized and Emotional Conversation	CPED	{emo+da}-GPT w/o emo	PPL	22.84	# 9
Personalized and Emotional Conversation	CPED	{emo+da}-GPT w/o emo	BLEU	0.1252	# 8
Personalized and Emotional Conversation	CPED	{emo+da}-GPT w/o emo	Distinct-1	0.0451	# 9
Personalized and Emotional Conversation	CPED	{emo+da}-GPT w/o emo	Distinct-2	0.2746	# 8
Personalized and Emotional Conversation	CPED	{emo+da}-GPT w/o emo	Greedy Embedding	0.4964	# 6
Personalized and Emotional Conversation	CPED	{emo+da}-GPT w/o emo	Average Embedding	0.5564	# 6
Personalized and Emotional Conversation	CPED	{emo+da}-GPT w/o emo	bertscore	0.5666	# 8
Personalized and Emotional Conversation	CPED	{emo+da}-GPT	PPL	21.60	# 7
Personalized and Emotional Conversation	CPED	{emo+da}-GPT	BLEU	0.1304	# 6
Personalized and Emotional Conversation	CPED	{emo+da}-GPT	Distinct-1	0.0476	# 7
Personalized and Emotional Conversation	CPED	{emo+da}-GPT	Distinct-2	0.2785	# 7
Personalized and Emotional Conversation	CPED	{emo+da}-GPT	Greedy Embedding	0.4962	# 7
Personalized and Emotional Conversation	CPED	{emo+da}-GPT	Average Embedding	0.5552	# 8
Personalized and Emotional Conversation	CPED	{emo+da}-GPT	bertscore	0.5674	# 6
Personalized and Emotional Conversation	CPED	GPT	PPL	20.07	# 6
Personalized and Emotional Conversation	CPED	GPT	BLEU	0.1171	# 9
Personalized and Emotional Conversation	CPED	GPT	Distinct-1	0.0482	# 6
Personalized and Emotional Conversation	CPED	GPT	Distinct-2	0.2738	# 9
Personalized and Emotional Conversation	CPED	GPT	Greedy Embedding	0.4922	# 9
Personalized and Emotional Conversation	CPED	GPT	Average Embedding	0.5509	# 9
Personalized and Emotional Conversation	CPED	GPT	bertscore	0.5629	# 9

Badge	Markdown
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/cped-a-large-scale-chinese-personalized-and-1/emotion-recognition-in-conversation-on-cped)](https://paperswithcode.com/sota/emotion-recognition-in-conversation-on-cped?p=cped-a-large-scale-chinese-personalized-and-1)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/cped-a-large-scale-chinese-personalized-and-1/personality-recognition-in-conversation-on-1)](https://paperswithcode.com/sota/personality-recognition-in-conversation-on-1?p=cped-a-large-scale-chinese-personalized-and-1)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/cped-a-large-scale-chinese-personalized-and-1/personalized-and-emotional-conversation-on)](https://paperswithcode.com/sota/personalized-and-emotional-conversation-on?p=cped-a-large-scale-chinese-personalized-and-1)`

CPED: A Large-Scale Chinese Personalized and Emotional Dialogue Dataset for Conversational AI

29 May 2022 · YiRong Chen, Weiquan Fan, Xiaofen Xing, Jianxin Pang, Minlie Huang, Wenjing Han, Qianfeng Tie, Xiangmin Xu ·

Human language expression is based on the subjective construal of the situation instead of the objective truth conditions, which means that speakers' personalities and emotions after cognitive processing have an important influence on conversation. However, most existing datasets for conversational AI ignore human personalities and emotions, or only consider part of them. It's difficult for dialogue systems to understand speakers' personalities and emotions although large-scale pre-training language models have been widely used. In order to consider both personalities and emotions in the process of conversation generation, we propose CPED, a large-scale Chinese personalized and emotional dialogue dataset, which consists of multi-source knowledge related to empathy and personal characteristic. These knowledge covers gender, Big Five personality traits, 13 emotions, 19 dialogue acts and 10 scenes. CPED contains more than 12K dialogues of 392 speakers from 40 TV shows. We release the textual dataset with audio features and video features according to the copyright claims, privacy issues, terms of service of video platforms. We provide detailed description of the CPED construction process and introduce three tasks for conversational AI, including personality recognition, emotion recognition in conversations as well as personalized and emotional conversation generation. Finally, we provide baseline systems for these tasks and consider the function of speakers' personalities and emotions on conversation. Our motivation is to propose a dataset to be widely adopted by the NLP community as a new open benchmark for conversational AI research. The full dataset is available at https://github.com/scutcyr/CPED.

PDF Abstract

Code

Add Remove Mark official

scutcyr/CPED official

180

Tasks

Add Remove

Chinese Sentiment Analysis

Conversational Response Generation

Dialog Act Classification

Dialogue Generation

Emotional Dialogue Acts

Emotion Recognition

Emotion Recognition in Conversation

Open-Domain Dialog

Personality Recognition in Conversation

Personality Trait Recognition

Personalized and Emotional Conversation

Datasets

Introduced in the Paper:

CPED

Results from the Paper

Edit

Ranked #1 on Emotion Recognition in Conversation on CPED

Get a GitHub badge

Task	Dataset	Model	Metric Name	Metric Value	Global Rank	Benchmark
Emotion Recognition in Conversation	CPED	BERT+AVG+MLP	Accuracy of Sentiment	51.50	# 1	Compare
Emotion Recognition in Conversation	CPED	BERT+AVG+MLP	Macro-F1 of Sentiment	48.02	# 1	Compare
Personality Recognition in Conversation	CPED	BERT$_{ssenet}^{c}$	Accuracy (%)	67.25	# 1	Compare
			Macro-F1	74.08	# 1	Compare
			Accuracy of Neurotism	53.27	# 3	Compare
			Accuracy of Extraversion	78.21	# 1	Compare
			Accuracy of Openness	55.42	# 2	Compare
			Accuracy of Agreeableness	85.89	# 1	Compare
			Accuracy of Conscientiousness	63.48	# 2	Compare
Personality Recognition in Conversation	CPED	BERT$_{senet}^{c}$	Accuracy (%)	66.02	# 4	Compare
			Macro-F1	71.89	# 4	Compare
			Accuracy of Neurotism	53.4	# 2	Compare
			Accuracy of Extraversion	77.71	# 4	Compare
			Accuracy of Openness	55.42	# 2	Compare
			Accuracy of Agreeableness	81.99	# 3	Compare
			Accuracy of Conscientiousness	61.59	# 4	Compare
Personality Recognition in Conversation	CPED	BERT$^{c}$	Accuracy (%)	66.32	# 3	Compare
			Macro-F1	72.69	# 3	Compare
			Accuracy of Neurotism	55.29	# 1	Compare
			Accuracy of Extraversion	78.08	# 2	Compare
			Accuracy of Openness	53.90	# 4	Compare
			Accuracy of Agreeableness	80.98	# 4	Compare
			Accuracy of Conscientiousness	63.35	# 3	Compare
Personality Recognition in Conversation	CPED	BERT$^{s}$	Accuracy (%)	67.23	# 2	Compare
			Macro-F1	72.93	# 2	Compare
			Accuracy of Neurotism	50.75	# 4	Compare
			Accuracy of Extraversion	78.08	# 2	Compare
			Accuracy of Openness	57.93	# 1	Compare
			Accuracy of Agreeableness	85.76	# 2	Compare
			Accuracy of Conscientiousness	63.60	# 1	Compare
Personalized and Emotional Conversation	CPED	GPT-{emo}	PPL	17.48	# 1	Compare
			BLEU	0.1342	# 5	Compare
			Distinct-1	0.0614	# 1	Compare
			Distinct-2	0.3430	# 1	Compare
			Greedy Embedding	0.4996	# 5	Compare
			Average Embedding	0.5588	# 5	Compare
			bertscore	0.5709	# 4	Compare
Personalized and Emotional Conversation	CPED	GPT-{per+emo+da}	PPL	17.80	# 4	Compare
			BLEU	0.1382	# 2	Compare
			Distinct-1	0.0601	# 4	Compare
			Distinct-2	0.3404	# 2	Compare
			Greedy Embedding	05012	# 1	Compare
			Average Embedding	0.5608	# 3	Compare
			bertscore	0.5722	# 1	Compare
Personalized and Emotional Conversation	CPED	GPT-{per+emo}	PPL	17.70	# 2	Compare
			BLEU	0.1403	# 1	Compare
			Distinct-1	0.0602	# 3	Compare
			Distinct-2	0.3388	# 4	Compare
			Greedy Embedding	0.5026	# 2	Compare
			Average Embedding	0.5617	# 1	Compare
			bertscore	0.5719	# 2	Compare
Personalized and Emotional Conversation	CPED	GPT-{da}	PPL	17.72	# 3	Compare
			BLEU	0.1372	# 3	Compare
			Distinct-1	0.0605	# 2	Compare
			Distinct-2	0.3389	# 3	Compare
			Greedy Embedding	0.5017	# 3	Compare
			Average Embedding	0.5610	# 2	Compare
			bertscore	0.5703	# 5	Compare
Personalized and Emotional Conversation	CPED	GPT-{per}	PPL	18.08	# 5	Compare
			BLEU	0.1372	# 3	Compare
			Distinct-1	0.0592	# 5	Compare
			Distinct-2	0.3363	# 5	Compare
			Greedy Embedding	0.5009	# 4	Compare
			Average Embedding	0.5606	# 4	Compare
			bertscore	0.5715	# 3	Compare
Personalized and Emotional Conversation	CPED	{emo+da}-GPT w/o da	PPL	22.09	# 8	Compare
			BLEU	0.1272	# 7	Compare
			Distinct-1	0.0473	# 8	Compare
			Distinct-2	0.2790	# 6	Compare
			Greedy Embedding	0.4962	# 7	Compare
			Average Embedding	0.5556	# 7	Compare
			bertscore	0.5669	# 7	Compare
Personalized and Emotional Conversation	CPED	{emo+da}-GPT w/o emo	PPL	22.84	# 9	Compare
			BLEU	0.1252	# 8	Compare
			Distinct-1	0.0451	# 9	Compare
			Distinct-2	0.2746	# 8	Compare
			Greedy Embedding	0.4964	# 6	Compare
			Average Embedding	0.5564	# 6	Compare
			bertscore	0.5666	# 8	Compare
Personalized and Emotional Conversation	CPED	{emo+da}-GPT	PPL	21.60	# 7	Compare
			BLEU	0.1304	# 6	Compare
			Distinct-1	0.0476	# 7	Compare
			Distinct-2	0.2785	# 7	Compare
			Greedy Embedding	0.4962	# 7	Compare
			Average Embedding	0.5552	# 8	Compare
			bertscore	0.5674	# 6	Compare
Personalized and Emotional Conversation	CPED	GPT	PPL	20.07	# 6	Compare
			BLEU	0.1171	# 9	Compare
			Distinct-1	0.0482	# 6	Compare
			Distinct-2	0.2738	# 9	Compare
			Greedy Embedding	0.4922	# 9	Compare
			Average Embedding	0.5509	# 9	Compare
			bertscore	0.5629	# 9	Compare

Methods

Add Remove

Adam • Attention Dropout • BERT • BPE • Cosine Annealing • Dense Connections • Discriminative Fine-Tuning • Dropout • GELU • GPT • Layer Normalization • Linear Layer • Linear Warmup With Cosine Annealing • Linear Warmup With Linear Decay • Multi-Head Attention • Residual Connection • Scaled Dot-Product Attention • Softmax • Weight Decay • WordPiece

Edit Social Preview

CPED: A Large-Scale Chinese Personalized and Emotional Dialogue Dataset for Conversational AI

Code Edit Add Remove Mark official

Tasks Edit Add Remove

Datasets Edit

Results from the Paper Edit

Methods Edit Add Remove

Code

Add Remove Mark official

Tasks

Add Remove

Datasets

Results from the Paper

Edit

Methods

Add Remove