TASK	DATASET	MODEL	METRIC NAME	METRIC VALUE	GLOBAL RANK
Action Classification	Kinetics-400	X3D-XXL	Acc@1	80.4	# 93
Action Classification	Kinetics-400	X3D-XXL	Acc@5	94.6	# 61
Action Classification	Kinetics-400	X3D-M	Acc@1	76	# 143
Action Classification	Kinetics-400	X3D-M	Acc@5	92.3	# 105
Action Classification	Kinetics-400	X3D-L	Acc@1	77.5	# 130
Action Classification	Kinetics-400	X3D-L	Acc@5	92.9	# 101
Action Classification	Kinetics-400	X3D-XL	Acc@1	79.1	# 110
Action Classification	Kinetics-400	X3D-XL	Acc@5	93.9	# 81

Badge	Markdown
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/x3d-expanding-architectures-for-efficient/action-classification-on-kinetics-400)](https://paperswithcode.com/sota/action-classification-on-kinetics-400?p=x3d-expanding-architectures-for-efficient)`

X3D: Expanding Architectures for Efficient Video Recognition

CVPR 2020 · Christoph Feichtenhofer ·

This paper presents X3D, a family of efficient video networks that progressively expand a tiny 2D image classification architecture along multiple network axes, in space, time, width and depth. Inspired by feature selection methods in machine learning, a simple stepwise network expansion approach is employed that expands a single axis in each step, such that good accuracy to complexity trade-off is achieved. To expand X3D to a specific target complexity, we perform progressive forward expansion followed by backward contraction. X3D achieves state-of-the-art performance while requiring 4.8x and 5.5x fewer multiply-adds and parameters for similar accuracy as previous work. Our most surprising finding is that networks with high spatiotemporal resolution can perform well, while being extremely light in terms of network width and parameters. We report competitive accuracy at unprecedented efficiency on video classification and detection benchmarks. Code will be available at: https://github.com/facebookresearch/SlowFast

PDF Abstract CVPR 2020 PDF CVPR 2020 Abstract

Code

Add Remove Mark official

facebookresearch/SlowFast official

6,268

open-mmlab/mmaction2

3,884

facebookresearch/pytorchvideo

↳ Quickstart in

Colab

Spaces

PyTorch Hub

3,182

kkahatapitiya/X3D-Multigrid

LukasHedegaard/co3d

See all 8 implementations

Tasks

Add Remove

Action Classification

feature selection

General Classification

Image Classification

Video Classification

Video Recognition

Datasets

ImageNet

Kinetics

Kinetics 400

Charades

Results from the Paper

Add Remove

Ranked #93 on Action Classification on Kinetics-400

Get a GitHub badge

Task	Dataset	Model	Metric Name	Metric Value	Global Rank	Benchmark
Action Classification	Kinetics-400	X3D-XXL	Acc@1	80.4	# 93	Compare
Action Classification	Kinetics-400	X3D-XXL	Acc@5	94.6	# 61	Compare
Action Classification	Kinetics-400	X3D-M	Acc@1	76	# 143	Compare
Action Classification	Kinetics-400	X3D-M	Acc@5	92.3	# 105	Compare
Action Classification	Kinetics-400	X3D-L	Acc@1	77.5	# 130	Compare
Action Classification	Kinetics-400	X3D-L	Acc@5	92.9	# 101	Compare
Action Classification	Kinetics-400	X3D-XL	Acc@1	79.1	# 110	Compare
Action Classification	Kinetics-400	X3D-XL	Acc@5	93.9	# 81	Compare

Methods

Add Remove

Feature Selection

Edit Social Preview

X3D: Expanding Architectures for Efficient Video Recognition

Code Edit Add Remove Mark official

Tasks Edit Add Remove

Datasets Edit

Results from the Paper Edit Add Remove

Methods Edit Add Remove

Code

Add Remove Mark official

Tasks

Add Remove

Datasets

Results from the Paper

Add Remove

Methods

Add Remove