TASK	DATASET	MODEL	METRIC NAME	METRIC VALUE	GLOBAL RANK
Action Recognition	NTU RGB+D 120	Gimme Signals (AIS)	Accuracy (Cross-Subject)	71.59	# 14
Action Recognition	NTU RGB+D 120	Gimme Signals (AIS)	Accuracy (Cross-Setup)	70.8	# 14
Skeleton Based Action Recognition	NTU RGB+D 120	Gimme Signals (Skeleton, AIS)	Accuracy (Cross-Subject)	70.8%	# 53
Skeleton Based Action Recognition	NTU RGB+D 120	Gimme Signals (Skeleton, AIS)	Accuracy (Cross-Setup)	71.6%	# 52
Multimodal Activity Recognition	UTD-MHAD	Gimme Signals (Skeleton, AIS)	Accuracy (CS)	93.33	# 2

Badge	Markdown
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/gimme-signals-discriminative-signal-encoding/multimodal-activity-recognition-on-utd-mhad)](https://paperswithcode.com/sota/multimodal-activity-recognition-on-utd-mhad?p=gimme-signals-discriminative-signal-encoding)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/gimme-signals-discriminative-signal-encoding/action-recognition-in-videos-on-ntu-rgbd-120)](https://paperswithcode.com/sota/action-recognition-in-videos-on-ntu-rgbd-120?p=gimme-signals-discriminative-signal-encoding)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/gimme-signals-discriminative-signal-encoding/skeleton-based-action-recognition-on-ntu-rgbd-1)](https://paperswithcode.com/sota/skeleton-based-action-recognition-on-ntu-rgbd-1?p=gimme-signals-discriminative-signal-encoding)`

Gimme Signals: Discriminative signal encoding for multimodal activity recognition

13 Mar 2020 · Raphael Memmesheimer, Nick Theisen, Dietrich Paulus ·

We present a simple, yet effective and flexible method for action recognition supporting multiple sensor modalities. Multivariate signal sequences are encoded in an image and are then classified using a recently proposed EfficientNet CNN architecture. Our focus was to find an approach that generalizes well across different sensor modalities without specific adaptions while still achieving good results. We apply our method to 4 action recognition datasets containing skeleton sequences, inertial and motion capturing measurements as well as \wifi fingerprints that range up to 120 action classes. Our method defines the current best CNN-based approach on the NTU RGB+D 120 dataset, lifts the state of the art on the ARIL Wi-Fi dataset by +6.78%, improves the UTD-MHAD inertial baseline by +14.4%, the UTD-MHAD skeleton baseline by 1.13% and achieves 96.11% on the Simitate motion capturing data (80/20 split). We further demonstrate experiments on both, modality fusion on a signal level and signal reduction to prevent the representation from overloading.

PDF Abstract

Code

Add Remove Mark official

airglow/gimme_signals_action_recogn… official

raphaelmemmesheimer/gimme_signals_a…

Tasks

Add Remove

Action Recognition

Activity Recognition

Multimodal Activity Recognition

Skeleton Based Action Recognition

Datasets

NTU RGB+D

NTU RGB+D 120

UTD-MHAD

Simitate

Results from the Paper

Edit

Ranked #2 on Multimodal Activity Recognition on UTD-MHAD

Get a GitHub badge

Task	Dataset	Model	Metric Name	Metric Value	Global Rank	Benchmark
Action Recognition	NTU RGB+D 120	Gimme Signals (AIS)	Accuracy (Cross-Subject)	71.59	# 14	Compare
Action Recognition	NTU RGB+D 120	Gimme Signals (AIS)	Accuracy (Cross-Setup)	70.8	# 14	Compare
Skeleton Based Action Recognition	NTU RGB+D 120	Gimme Signals (Skeleton, AIS)	Accuracy (Cross-Subject)	70.8%	# 53	Compare
Skeleton Based Action Recognition	NTU RGB+D 120	Gimme Signals (Skeleton, AIS)	Accuracy (Cross-Setup)	71.6%	# 52	Compare
Multimodal Activity Recognition	UTD-MHAD	Gimme Signals (Skeleton, AIS)	Accuracy (CS)	93.33	# 2	Compare

Methods

Add Remove

1x1 Convolution • Average Pooling • Batch Normalization • Convolution • Dense Connections • Depthwise Convolution • Depthwise Separable Convolution • Dropout • EfficientNet • Inverted Residual Block • Pointwise Convolution • ReLU • RMSProp • Sigmoid Activation • Squeeze-and-Excitation Block • Swish

Edit Social Preview

Gimme Signals: Discriminative signal encoding for multimodal activity recognition

Code Edit Add Remove Mark official

Tasks Edit Add Remove

Datasets Edit

Results from the Paper Edit

Methods Edit Add Remove

Code

Add Remove Mark official

Tasks

Add Remove

Datasets

Results from the Paper

Edit

Methods

Add Remove