TASK	DATASET	MODEL	METRIC NAME	METRIC VALUE	GLOBAL RANK
Multimodal Activity Recognition	EV-Action	ST-GCN (Skeleton Kinect)	Accuracy	79.6	# 2
Multimodal Activity Recognition	EV-Action	ST-GCN (Skeleton Vicon)	Accuracy	50.7	# 7
3D Human Pose Estimation	Human3.6M	ST-GCN	Average MPJPE (mm)	57.4	# 234
Action Recognition	ICVL-4	ST-GCN	Accuracy	80.23%	# 2
Action Recognition	IRD	ST-GCN	Accuracy	74.03%	# 2
Skeleton Based Action Recognition	NTU RGB+D	ST-GCN	Accuracy (CV)	88.3	# 91
Skeleton Based Action Recognition	NTU RGB+D	ST-GCN	Accuracy (CS)	81.5	# 93
Skeleton Based Action Recognition	NTU RGB+D	ST-GCN [Vanilla, 2D Skeleton]	Accuracy (CV)	95.1	# 46
Skeleton Based Action Recognition	NTU RGB+D	ST-GCN [Vanilla, 2D Skeleton]	Accuracy (CS)	90.1	# 39
Skeleton Based Action Recognition	NTU RGB+D	ST-GCN [Vanilla, 3D Skeleton]	Accuracy (CV)	93.2	# 68
Skeleton Based Action Recognition	NTU RGB+D	ST-GCN [Vanilla, 3D Skeleton]	Accuracy (CS)	86.6	# 66
Skeleton Based Action Recognition	NTU RGB+D	ST-GCN [PYSKL, 3D Skeleton]	Accuracy (CV)	96.5	# 22
Skeleton Based Action Recognition	NTU RGB+D	ST-GCN [PYSKL, 3D Skeleton]	Accuracy (CS)	90.7	# 34
Skeleton Based Action Recognition	NTU RGB+D 120	ST-GCN [PYSKL, 3D Skeleton]	Accuracy (Cross-Subject)	86.2	# 31
Skeleton Based Action Recognition	NTU RGB+D 120	ST-GCN [PYSKL, 3D Skeleton]	Accuracy (Cross-Setup)	88.4	# 27
Skeleton Based Action Recognition	NTU RGB+D 120	ST-GCN [PYSKL, 2D Skeleton]	Accuracy (Cross-Subject)	84.7	# 38
Skeleton Based Action Recognition	NTU RGB+D 120	ST-GCN [PYSKL, 2D Skeleton]	Accuracy (Cross-Setup)	89.0	# 24
Skeleton Based Action Recognition	UAV-Human	ST-GCN	CSv1(%)	30.25	# 6
Skeleton Based Action Recognition	UAV-Human	ST-GCN	CSv2(%)	56.14	# 5
Skeleton Based Action Recognition	Varying-view RGB-D Action-Skeleton	ST-GCN	Accuracy (CS)	71%	# 2
Skeleton Based Action Recognition	Varying-view RGB-D Action-Skeleton	ST-GCN	Accuracy (CV I)	25%	# 3
Skeleton Based Action Recognition	Varying-view RGB-D Action-Skeleton	ST-GCN	Accuracy (CV II)	56%	# 3
Skeleton Based Action Recognition	Varying-view RGB-D Action-Skeleton	ST-GCN	Accuracy (AV I)	53%	# 2
Skeleton Based Action Recognition	Varying-view RGB-D Action-Skeleton	ST-GCN	Accuracy (AV II)	43%	# 7

Badge	Markdown
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/spatial-temporal-graph-convolutional-networks-1/multimodal-activity-recognition-on-ev-action)](https://paperswithcode.com/sota/multimodal-activity-recognition-on-ev-action?p=spatial-temporal-graph-convolutional-networks-1)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/spatial-temporal-graph-convolutional-networks-1/action-recognition-in-videos-on-icvl-4)](https://paperswithcode.com/sota/action-recognition-in-videos-on-icvl-4?p=spatial-temporal-graph-convolutional-networks-1)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/spatial-temporal-graph-convolutional-networks-1/action-recognition-in-videos-on-ird)](https://paperswithcode.com/sota/action-recognition-in-videos-on-ird?p=spatial-temporal-graph-convolutional-networks-1)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/spatial-temporal-graph-convolutional-networks-1/skeleton-based-action-recognition-on-varying)](https://paperswithcode.com/sota/skeleton-based-action-recognition-on-varying?p=spatial-temporal-graph-convolutional-networks-1)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/spatial-temporal-graph-convolutional-networks-1/skeleton-based-action-recognition-on-uav)](https://paperswithcode.com/sota/skeleton-based-action-recognition-on-uav?p=spatial-temporal-graph-convolutional-networks-1)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/spatial-temporal-graph-convolutional-networks-1/skeleton-based-action-recognition-on-ntu-rgbd-1)](https://paperswithcode.com/sota/skeleton-based-action-recognition-on-ntu-rgbd-1?p=spatial-temporal-graph-convolutional-networks-1)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/spatial-temporal-graph-convolutional-networks-1/skeleton-based-action-recognition-on-ntu-rgbd)](https://paperswithcode.com/sota/skeleton-based-action-recognition-on-ntu-rgbd?p=spatial-temporal-graph-convolutional-networks-1)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/spatial-temporal-graph-convolutional-networks-1/3d-human-pose-estimation-on-human36m)](https://paperswithcode.com/sota/3d-human-pose-estimation-on-human36m?p=spatial-temporal-graph-convolutional-networks-1)`

Spatial Temporal Graph Convolutional Networks for Skeleton-Based Action Recognition

23 Jan 2018 · Sijie Yan, Yuanjun Xiong, Dahua Lin ·

Dynamics of human body skeletons convey significant information for human action recognition. Conventional approaches for modeling skeletons usually rely on hand-crafted parts or traversal rules, thus resulting in limited expressive power and difficulties of generalization. In this work, we propose a novel model of dynamic skeletons called Spatial-Temporal Graph Convolutional Networks (ST-GCN), which moves beyond the limitations of previous methods by automatically learning both the spatial and temporal patterns from data. This formulation not only leads to greater expressive power but also stronger generalization capability. On two large datasets, Kinetics and NTU-RGBD, it achieves substantial improvements over mainstream methods.

PDF Abstract

Code

Add Remove Mark official

yysijie/st-gcn official

1,417

open-mmlab/mmskeleton

2,851

PaddlePaddle/PaddleVideo

1,416

kennymckormick/pyskl

853

XinzeWu/st-GCN

See all 24 implementations

Tasks

Add Remove

3D Human Pose Estimation

Action Recognition

Multimodal Activity Recognition

Skeleton Based Action Recognition

Temporal Action Localization

Datasets

Kinetics

Human3.6M

NTU RGB+D

NTU RGB+D 120

UAV-Human ICVL

Results from the Paper

Edit

Ranked #2 on Skeleton Based Action Recognition on Varying-view RGB-D Action-Skeleton

Get a GitHub badge

Task	Dataset	Model	Metric Name	Metric Value	Global Rank	Benchmark
Multimodal Activity Recognition	EV-Action	ST-GCN (Skeleton Kinect)	Accuracy	79.6	# 2	Compare
Multimodal Activity Recognition	EV-Action	ST-GCN (Skeleton Vicon)	Accuracy	50.7	# 7	Compare
3D Human Pose Estimation	Human3.6M	ST-GCN	Average MPJPE (mm)	57.4	# 234	Compare
Action Recognition	ICVL-4	ST-GCN	Accuracy	80.23%	# 2	Compare
Action Recognition	IRD	ST-GCN	Accuracy	74.03%	# 2	Compare
Skeleton Based Action Recognition	NTU RGB+D	ST-GCN	Accuracy (CV)	88.3	# 91	Compare
Skeleton Based Action Recognition	NTU RGB+D	ST-GCN	Accuracy (CS)	81.5	# 93	Compare
Skeleton Based Action Recognition	NTU RGB+D	ST-GCN [Vanilla, 2D Skeleton]	Accuracy (CV)	95.1	# 46	Compare
Skeleton Based Action Recognition	NTU RGB+D	ST-GCN [Vanilla, 2D Skeleton]	Accuracy (CS)	90.1	# 39	Compare
Skeleton Based Action Recognition	NTU RGB+D	ST-GCN [Vanilla, 3D Skeleton]	Accuracy (CV)	93.2	# 68	Compare
Skeleton Based Action Recognition	NTU RGB+D	ST-GCN [Vanilla, 3D Skeleton]	Accuracy (CS)	86.6	# 66	Compare
Skeleton Based Action Recognition	NTU RGB+D	ST-GCN [PYSKL, 3D Skeleton]	Accuracy (CV)	96.5	# 22	Compare
Skeleton Based Action Recognition	NTU RGB+D	ST-GCN [PYSKL, 3D Skeleton]	Accuracy (CS)	90.7	# 34	Compare
Skeleton Based Action Recognition	NTU RGB+D 120	ST-GCN [PYSKL, 3D Skeleton]	Accuracy (Cross-Subject)	86.2	# 31	Compare
Skeleton Based Action Recognition	NTU RGB+D 120	ST-GCN [PYSKL, 3D Skeleton]	Accuracy (Cross-Setup)	88.4	# 27	Compare
Skeleton Based Action Recognition	NTU RGB+D 120	ST-GCN [PYSKL, 2D Skeleton]	Accuracy (Cross-Subject)	84.7	# 38	Compare
Skeleton Based Action Recognition	NTU RGB+D 120	ST-GCN [PYSKL, 2D Skeleton]	Accuracy (Cross-Setup)	89.0	# 24	Compare
Skeleton Based Action Recognition	UAV-Human	ST-GCN	CSv1(%)	30.25	# 6	Compare
Skeleton Based Action Recognition	UAV-Human	ST-GCN	CSv2(%)	56.14	# 5	Compare
Skeleton Based Action Recognition	Varying-view RGB-D Action-Skeleton	ST-GCN	Accuracy (CS)	71%	# 2	Compare
			Accuracy (CV I)	25%	# 3	Compare
			Accuracy (CV II)	56%	# 3	Compare
			Accuracy (AV I)	53%	# 2	Compare
			Accuracy (AV II)	43%	# 7	Compare

Methods

Add Remove

No methods listed for this paper. Add relevant methods here

Edit Social Preview

Spatial Temporal Graph Convolutional Networks for Skeleton-Based Action Recognition

Code Edit Add Remove Mark official

Tasks Edit Add Remove

Datasets Edit

Results from the Paper Edit

Methods Edit Add Remove

Code

Add Remove Mark official

Tasks

Add Remove

Datasets

Results from the Paper

Edit

Methods

Add Remove