TASK	DATASET	MODEL	METRIC NAME	METRIC VALUE	GLOBAL RANK
Video Object Segmentation	DAVIS 2017	UniTrack	mIoU	58.4	# 2
Pose Estimation	J-HMDB	UniTrack_i18	Mean PCK@0.2	80.5	# 5
Pose Estimation	J-HMDB	UniTrack_i18	Mean PCK@0.1	58.3	# 3
Multi-Object Tracking	MOT16	UniTrack	MOTA	74.7	# 6
Multi-Object Tracking	MOT16	UniTrack	IDF1	71.8	# 4
Multi-Object Tracking	MOT16	UniTrack	IDs	683	# 2
Multi-Object Tracking	MOTS20	UniTrack	sMOTSA	68.9	# 2
Multi-Object Tracking	MOTS20	UniTrack	IDF1	67.2	# 1
Multi-Object Tracking	MOTS20	UniTrack	IDs	622	# 1
Visual Object Tracking	OTB-2015	UniTrack_DCF	AUC	0.618	# 12
Pose Tracking	PoseTrack2018	UniTrack	MOTA	63.5	# 2
Pose Tracking	PoseTrack2018	UniTrack	IDF1	73.2	# 2
Pose Tracking	PoseTrack2018	UniTrack	IDs	6760	# 1
Video Instance Segmentation	YouTube-VIS validation	UniTrack	mask AP	30.1	# 50

Badge	Markdown
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/do-different-tracking-tasks-require-different/video-object-segmentation-on-davis-2017)](https://paperswithcode.com/sota/video-object-segmentation-on-davis-2017?p=do-different-tracking-tasks-require-different)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/do-different-tracking-tasks-require-different/multi-object-tracking-on-mots20)](https://paperswithcode.com/sota/multi-object-tracking-on-mots20?p=do-different-tracking-tasks-require-different)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/do-different-tracking-tasks-require-different/pose-tracking-on-posetrack2018)](https://paperswithcode.com/sota/pose-tracking-on-posetrack2018?p=do-different-tracking-tasks-require-different)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/do-different-tracking-tasks-require-different/pose-estimation-on-j-hmdb)](https://paperswithcode.com/sota/pose-estimation-on-j-hmdb?p=do-different-tracking-tasks-require-different)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/do-different-tracking-tasks-require-different/multi-object-tracking-on-mot16)](https://paperswithcode.com/sota/multi-object-tracking-on-mot16?p=do-different-tracking-tasks-require-different)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/do-different-tracking-tasks-require-different/visual-object-tracking-on-otb-2015)](https://paperswithcode.com/sota/visual-object-tracking-on-otb-2015?p=do-different-tracking-tasks-require-different)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/do-different-tracking-tasks-require-different/video-instance-segmentation-on-youtube-vis-1)](https://paperswithcode.com/sota/video-instance-segmentation-on-youtube-vis-1?p=do-different-tracking-tasks-require-different)`

Do Different Tracking Tasks Require Different Appearance Models?

NeurIPS 2021 · Zhongdao Wang, Hengshuang Zhao, Ya-Li Li, Shengjin Wang, Philip H. S. Torr, Luca Bertinetto ·

Tracking objects of interest in a video is one of the most popular and widely applicable problems in computer vision. However, with the years, a Cambrian explosion of use cases and benchmarks has fragmented the problem in a multitude of different experimental setups. As a consequence, the literature has fragmented too, and now novel approaches proposed by the community are usually specialised to fit only one specific setup. To understand to what extent this specialisation is necessary, in this work we present UniTrack, a solution to address five different tasks within the same framework. UniTrack consists of a single and task-agnostic appearance model, which can be learned in a supervised or self-supervised fashion, and multiple ``heads'' that address individual tasks and do not require training. We show how most tracking tasks can be solved within this framework, and that the same appearance model can be successfully used to obtain results that are competitive against specialised methods for most of the tasks considered. The framework also allows us to analyse appearance models obtained with the most recent self-supervised methods, thus extending their evaluation and comparison to a larger variety of important problems.

PDF Abstract NeurIPS 2021 PDF NeurIPS 2021 Abstract

Code

Add Remove Mark official

Zhongdao/UniTrack official

335

Tasks

Add Remove

Multi-Object Tracking

Multi-Object Tracking and Segmentation

Multiple People Tracking

Object Tracking

Online Multi-Object Tracking

Pose Estimation

Pose Prediction

Pose Tracking

Semi-Supervised Video Object Segmentation

Video Instance Segmentation

Video Object Segmentation

Video Object Tracking

Visual Object Tracking

Visual Tracking

Datasets

ImageNet

DAVIS

OTB

DAVIS 2017

JHMDB FlyingChairs

MOTChallenge

OTB-2015

YouTube-VIS 2019

MOT16

PoseTrack

Results from the Paper

Edit

Ranked #2 on Video Object Segmentation on DAVIS 2017 (mIoU metric)

Get a GitHub badge

Task	Dataset	Model	Metric Name	Metric Value	Global Rank	Benchmark
Video Object Segmentation	DAVIS 2017	UniTrack	mIoU	58.4	# 2	Compare
Pose Estimation	J-HMDB	UniTrack_i18	Mean PCK@0.2	80.5	# 5	Compare
Pose Estimation	J-HMDB	UniTrack_i18	Mean PCK@0.1	58.3	# 3	Compare
Multi-Object Tracking	MOT16	UniTrack	MOTA	74.7	# 6	Compare
			IDF1	71.8	# 4	Compare
			IDs	683	# 2	Compare
Multi-Object Tracking	MOTS20	UniTrack	sMOTSA	68.9	# 2	Compare
			IDF1	67.2	# 1	Compare
			IDs	622	# 1	Compare
Visual Object Tracking	OTB-2015	UniTrack_DCF	AUC	0.618	# 12	Compare
Pose Tracking	PoseTrack2018	UniTrack	MOTA	63.5	# 2	Compare
			IDF1	73.2	# 2	Compare
			IDs	6760	# 1	Compare
Video Instance Segmentation	YouTube-VIS validation	UniTrack	mask AP	30.1	# 50	Compare

Methods

Add Remove

No methods listed for this paper. Add relevant methods here

Edit Social Preview

Do Different Tracking Tasks Require Different Appearance Models?

Code Edit Add Remove Mark official

Tasks Edit Add Remove

Datasets Edit

Results from the Paper Edit

Methods Edit Add Remove

Code

Add Remove Mark official

Tasks

Add Remove

Datasets

Results from the Paper

Edit

Methods

Add Remove