TASK	DATASET	MODEL	METRIC NAME	METRIC VALUE	GLOBAL RANK
Multimodal Activity Recognition	EV-Action	TCN (Skeleton Kinect)	Accuracy	80.1	# 1
Multimodal Activity Recognition	EV-Action	TCN (Skeleton Vicon)	Accuracy	64.1	# 6
Skeleton Based Action Recognition	NTU RGB+D	TCN	Accuracy (CV)	83.1	# 103
Skeleton Based Action Recognition	NTU RGB+D	TCN	Accuracy (CS)	74.3	# 109
Skeleton Based Action Recognition	Varying-view RGB-D Action-Skeleton	Res-TCN	Accuracy (CS)	63%	# 3
Skeleton Based Action Recognition	Varying-view RGB-D Action-Skeleton	Res-TCN	Accuracy (CV I)	14%	# 6
Skeleton Based Action Recognition	Varying-view RGB-D Action-Skeleton	Res-TCN	Accuracy (CV II)	48%	# 4
Skeleton Based Action Recognition	Varying-view RGB-D Action-Skeleton	Res-TCN	Accuracy (AV I)	48%	# 3
Skeleton Based Action Recognition	Varying-view RGB-D Action-Skeleton	Res-TCN	Accuracy (AV II)	68%	# 3

Badge	Markdown
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/interpretable-3d-human-action-analysis-with/multimodal-activity-recognition-on-ev-action)](https://paperswithcode.com/sota/multimodal-activity-recognition-on-ev-action?p=interpretable-3d-human-action-analysis-with)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/interpretable-3d-human-action-analysis-with/skeleton-based-action-recognition-on-varying)](https://paperswithcode.com/sota/skeleton-based-action-recognition-on-varying?p=interpretable-3d-human-action-analysis-with)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/interpretable-3d-human-action-analysis-with/skeleton-based-action-recognition-on-ntu-rgbd)](https://paperswithcode.com/sota/skeleton-based-action-recognition-on-ntu-rgbd?p=interpretable-3d-human-action-analysis-with)`

Interpretable 3D Human Action Analysis with Temporal Convolutional Networks

14 Apr 2017 · Tae Soo Kim, Austin Reiter ·

The discriminative power of modern deep learning models for 3D human action recognition is growing ever so potent. In conjunction with the recent resurgence of 3D human action representation with 3D skeletons, the quality and the pace of recent progress have been significant. However, the inner workings of state-of-the-art learning based methods in 3D human action recognition still remain mostly black-box. In this work, we propose to use a new class of models known as Temporal Convolutional Neural Networks (TCN) for 3D human action recognition. Compared to popular LSTM-based Recurrent Neural Network models, given interpretable input such as 3D skeletons, TCN provides us a way to explicitly learn readily interpretable spatio-temporal representations for 3D human action recognition. We provide our strategy in re-designing the TCN with interpretability in mind and how such characteristics of the model is leveraged to construct a powerful 3D activity recognition method. Through this work, we wish to take a step towards a spatio-temporal model that is easier to understand, explain and interpret. The resulting model, Res-TCN, achieves state-of-the-art results on the largest 3D human action recognition dataset, NTU-RGBD.

PDF Abstract

Code

Add Remove Mark official

TaeSoo-Kim/TCNActionRecognition official

122

Tasks

Add Remove

3D Action Recognition

Action Analysis

Action Recognition

Activity Recognition

Multimodal Activity Recognition

Skeleton Based Action Recognition

Temporal Action Localization

Datasets

NTU RGB+D

Results from the Paper

Edit

Ranked #1 on Multimodal Activity Recognition on EV-Action

Get a GitHub badge

Task	Dataset	Model	Metric Name	Metric Value	Global Rank	Benchmark
Multimodal Activity Recognition	EV-Action	TCN (Skeleton Kinect)	Accuracy	80.1	# 1	Compare
Multimodal Activity Recognition	EV-Action	TCN (Skeleton Vicon)	Accuracy	64.1	# 6	Compare
Skeleton Based Action Recognition	NTU RGB+D	TCN	Accuracy (CV)	83.1	# 103	Compare
Skeleton Based Action Recognition	NTU RGB+D	TCN	Accuracy (CS)	74.3	# 109	Compare
Skeleton Based Action Recognition	Varying-view RGB-D Action-Skeleton	Res-TCN	Accuracy (CS)	63%	# 3	Compare
			Accuracy (CV I)	14%	# 6	Compare
			Accuracy (CV II)	48%	# 4	Compare
			Accuracy (AV I)	48%	# 3	Compare
			Accuracy (AV II)	68%	# 3	Compare

Methods

Add Remove

No methods listed for this paper. Add relevant methods here

Edit Social Preview

Interpretable 3D Human Action Analysis with Temporal Convolutional Networks

Code Edit Add Remove Mark official

Tasks Edit Add Remove

Datasets Edit

Results from the Paper Edit

Methods Edit Add Remove

Code

Add Remove Mark official

Tasks

Add Remove

Datasets

Results from the Paper

Edit

Methods

Add Remove