TASK	DATASET	MODEL	METRIC NAME	METRIC VALUE	GLOBAL RANK
Temporal Action Localization	MEXaction2	S-CNN	mAP	7.4	# 1
Temporal Action Localization	THUMOS’14	S-CNN	mAP IOU@0.5	19	# 36
Temporal Action Localization	THUMOS’14	S-CNN	mAP IOU@0.1	47.7	# 11
Temporal Action Localization	THUMOS’14	S-CNN	mAP IOU@0.2	43.5	# 10
Temporal Action Localization	THUMOS’14	S-CNN	mAP IOU@0.3	36.3	# 34
Temporal Action Localization	THUMOS’14	S-CNN	mAP IOU@0.4	28.7	# 33
Action Recognition	THUMOS’14	Shou et. al.	mAP@0.1	47.7	# 5
Action Recognition	THUMOS’14	Shou et. al.	mAP@0.2	43.5	# 5
Action Recognition	THUMOS’14	Shou et. al.	mAP@0.3	36.3	# 8
Action Recognition	THUMOS’14	Shou et. al.	mAP@0.4	28.7	# 9
Action Recognition	THUMOS’14	Shou et. al.	mAP@0.5	19.0	# 9

Badge	Markdown
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/temporal-action-localization-in-untrimmed/temporal-action-localization-on-mexaction2)](https://paperswithcode.com/sota/temporal-action-localization-on-mexaction2?p=temporal-action-localization-in-untrimmed)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/temporal-action-localization-in-untrimmed/action-recognition-in-videos-on-thumos14)](https://paperswithcode.com/sota/action-recognition-in-videos-on-thumos14?p=temporal-action-localization-in-untrimmed)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/temporal-action-localization-in-untrimmed/temporal-action-localization-on-thumos14)](https://paperswithcode.com/sota/temporal-action-localization-on-thumos14?p=temporal-action-localization-in-untrimmed)`

Temporal Action Localization in Untrimmed Videos via Multi-stage CNNs

CVPR 2016 · Zheng Shou, Dongang Wang, Shih-Fu Chang ·

We address temporal action localization in untrimmed long videos. This is important because videos in real applications are usually unconstrained and contain multiple action instances plus video content of background scenes or other activities. To address this challenging issue, we exploit the effectiveness of deep networks in temporal action localization via three segment-based 3D ConvNets: (1) a proposal network identifies candidate segments in a long video that may contain actions; (2) a classification network learns one-vs-all action classification model to serve as initialization for the localization network; and (3) a localization network fine-tunes on the learned classification network to localize each action instance. We propose a novel loss function for the localization network to explicitly consider temporal overlap and therefore achieve high temporal localization accuracy. Only the proposal network and the localization network are used during prediction. On two large-scale benchmarks, our approach achieves significantly superior performances compared with other state-of-the-art systems: mAP increases from 1.7% to 7.4% on MEXaction2 and increases from 15.0% to 19.0% on THUMOS 2014, when the overlap threshold for evaluation is set to 0.5.

PDF Abstract CVPR 2016 PDF CVPR 2016 Abstract

Code

Add Remove Mark official

zhengshou/scnn official

232

Tasks

Add Remove

Action Classification

Action Localization

Classification

General Classification

Temporal Action Localization

Temporal Localization

Datasets

UCF101

THUMOS14

Results from the Paper

Edit

Ranked #1 on Temporal Action Localization on MEXaction2

Get a GitHub badge

Task	Dataset	Model	Metric Name	Metric Value	Global Rank	Benchmark
Temporal Action Localization	MEXaction2	S-CNN	mAP	7.4	# 1	Compare
Temporal Action Localization	THUMOS’14	S-CNN	mAP IOU@0.5	19	# 36	Compare
			mAP IOU@0.1	47.7	# 11	Compare
			mAP IOU@0.2	43.5	# 10	Compare
			mAP IOU@0.3	36.3	# 34	Compare
			mAP IOU@0.4	28.7	# 33	Compare
Action Recognition	THUMOS’14	Shou et. al.	mAP@0.1	47.7	# 5	Compare
			mAP@0.2	43.5	# 5	Compare
			mAP@0.3	36.3	# 8	Compare
			mAP@0.4	28.7	# 9	Compare
			mAP@0.5	19.0	# 9	Compare

Methods

Add Remove

No methods listed for this paper. Add relevant methods here

Edit Social Preview

Temporal Action Localization in Untrimmed Videos via Multi-stage CNNs

Code Edit Add Remove Mark official

Tasks Edit Add Remove

Datasets Edit

Results from the Paper Edit

Methods Edit Add Remove

Code

Add Remove Mark official

Tasks

Add Remove

Datasets

Results from the Paper

Edit

Methods

Add Remove