TASK	DATASET	MODEL	METRIC NAME	METRIC VALUE	GLOBAL RANK
Instance Segmentation	COCO minival	QueryInst (single scale)	mask AP	48.9	# 28
Instance Segmentation	COCO minival	QueryInst (single scale)	AP50	74.0	# 5
Instance Segmentation	COCO minival	QueryInst (single scale)	AP75	53.9	# 4
Instance Segmentation	COCO minival	QueryInst (single scale)	APL	68.3	# 4
Instance Segmentation	COCO minival	QueryInst (single scale)	APM	52.6	# 4
Instance Segmentation	COCO minival	QueryInst (single scale)	APS	30.8	# 4
Object Detection	COCO minival	QueryInst (single scale)	box AP	56.1	# 43
Object Detection	COCO minival	QueryInst (single scale)	AP50	75.8	# 6
Object Detection	COCO minival	QueryInst (single scale)	AP75	61.7	# 3
Object Detection	COCO minival	QueryInst (single scale)	APS	40.2	# 5
Object Detection	COCO minival	QueryInst (single scale)	APM	59.8	# 5
Object Detection	COCO minival	QueryInst (single scale)	APL	71.5	# 7
Object Detection	COCO-O	QueryInst (Swin-L)	Average mAP	33.2	# 13
Object Detection	COCO-O	QueryInst (Swin-L)	Effective Robustness	8.26	# 11
Object Detection	COCO test-dev	QueryInst (single-scale)	box mAP	56.1	# 40
Object Detection	COCO test-dev	QueryInst (single-scale)	AP50	75.9	# 7
Object Detection	COCO test-dev	QueryInst (single-scale)	AP75	61.9	# 8
Object Detection	COCO test-dev	QueryInst (single-scale)	APS	37.4	# 9
Object Detection	COCO test-dev	QueryInst (single-scale)	APM	58.9	# 10
Object Detection	COCO test-dev	QueryInst (single-scale)	APL	70.3	# 9
Object Detection	COCO test-dev	QueryInst (single-scale)	Hardware Burden	17G	# 1
Object Detection	COCO test-dev	QueryInst (single-scale)	Operations per network pass	None	# 1
Instance Segmentation	COCO test-dev	QueryInst (single scale)	mask AP	49.1	# 22
Instance Segmentation	COCO test-dev	QueryInst (single scale)	AP50	74.2	# 7
Instance Segmentation	COCO test-dev	QueryInst (single scale)	AP75	53.8	# 6
Instance Segmentation	COCO test-dev	QueryInst (single scale)	APS	31.5	# 7
Instance Segmentation	COCO test-dev	QueryInst (single scale)	APM	51.8	# 6
Instance Segmentation	COCO test-dev	QueryInst (single scale)	APL	63.2	# 7

Badge	Markdown
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/queryinst-parallelly-supervised-mask-query/object-detection-on-coco-o)](https://paperswithcode.com/sota/object-detection-on-coco-o?p=queryinst-parallelly-supervised-mask-query)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/queryinst-parallelly-supervised-mask-query/instance-segmentation-on-coco)](https://paperswithcode.com/sota/instance-segmentation-on-coco?p=queryinst-parallelly-supervised-mask-query)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/queryinst-parallelly-supervised-mask-query/instance-segmentation-on-coco-minival)](https://paperswithcode.com/sota/instance-segmentation-on-coco-minival?p=queryinst-parallelly-supervised-mask-query)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/queryinst-parallelly-supervised-mask-query/object-detection-on-coco)](https://paperswithcode.com/sota/object-detection-on-coco?p=queryinst-parallelly-supervised-mask-query)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/queryinst-parallelly-supervised-mask-query/object-detection-on-coco-minival)](https://paperswithcode.com/sota/object-detection-on-coco-minival?p=queryinst-parallelly-supervised-mask-query)`

Instances as Queries

ICCV 2021 · Yuxin Fang, Shusheng Yang, Xinggang Wang, Yu Li, Chen Fang, Ying Shan, Bin Feng, Wenyu Liu ·

Recently, query based object detection frameworks achieve comparable performance with previous state-of-the-art object detectors. However, how to fully leverage such frameworks to perform instance segmentation remains an open problem. In this paper, we present QueryInst (Instances as Queries), a query based instance segmentation method driven by parallel supervision on dynamic mask heads. The key insight of QueryInst is to leverage the intrinsic one-to-one correspondence in object queries across different stages, as well as one-to-one correspondence between mask RoI features and object queries in the same stage. This approach eliminates the explicit multi-stage mask head connection and the proposal distribution inconsistency issues inherent in non-query based multi-stage instance segmentation methods. We conduct extensive experiments on three challenging benchmarks, i.e., COCO, CityScapes, and YouTube-VIS to evaluate the effectiveness of QueryInst in instance segmentation and video instance segmentation (VIS) task. Specifically, using ResNet-101-FPN backbone, QueryInst obtains 48.1 box AP and 42.8 mask AP on COCO test-dev, which is 2 points higher than HTC in terms of both box AP and mask AP, while runs 2.4 times faster. For video instance segmentation, QueryInst achieves the best performance among all online VIS approaches and strikes a decent speed-accuracy trade-off. Code is available at \url{https://github.com/hustvl/QueryInst}.

PDF Abstract ICCV 2021 PDF ICCV 2021 Abstract

Code

Add Remove Mark official

hustvl/QueryInst official

400

open-mmlab/mmdetection

27,806

Bo396543018/picodet_repro

sty16/cell_mmdetection

flyfly666/mmdetection2.18.1

Tasks

Add Remove

Instance Segmentation

Object

object-detection

Object Detection

Segmentation

Video Instance Segmentation

Datasets

MS COCO

Cityscapes

YouTube-VIS 2019

COCO-O

Results from the Paper

Edit

Ranked #13 on Object Detection on COCO-O (using extra training data)

Get a GitHub badge

Task	Dataset	Model	Metric Name	Metric Value	Global Rank	Benchmark
Instance Segmentation	COCO minival	QueryInst (single scale)	mask AP	48.9	# 28	Compare
			AP50	74.0	# 5	Compare
			AP75	53.9	# 4	Compare
			APL	68.3	# 4	Compare
			APM	52.6	# 4	Compare
			APS	30.8	# 4	Compare
Object Detection	COCO minival	QueryInst (single scale)	box AP	56.1	# 43	Compare
			AP50	75.8	# 6	Compare
			AP75	61.7	# 3	Compare
			APS	40.2	# 5	Compare
			APM	59.8	# 5	Compare
			APL	71.5	# 7	Compare
Object Detection	COCO-O	QueryInst (Swin-L)	Average mAP	33.2	# 13	Compare
Object Detection	COCO-O	QueryInst (Swin-L)	Effective Robustness	8.26	# 11	Compare
Object Detection	COCO test-dev	QueryInst (single-scale)	box mAP	56.1	# 40	Compare
			AP50	75.9	# 7	Compare
			AP75	61.9	# 8	Compare
			APS	37.4	# 9	Compare
			APM	58.9	# 10	Compare
			APL	70.3	# 9	Compare
			Hardware Burden	17G	# 1	Compare
			Operations per network pass	None	# 1	Compare
Instance Segmentation	COCO test-dev	QueryInst (single scale)	mask AP	49.1	# 22	Compare
			AP50	74.2	# 7	Compare
			AP75	53.8	# 6	Compare
			APS	31.5	# 7	Compare
			APM	51.8	# 6	Compare
			APL	63.2	# 7	Compare

Methods

Add Remove

Absolute Position Encodings • Cascade Mask R-CNN • Cascade R-CNN • Convolution • Dense Connections • Detr • DynamicConv • Faster R-CNN • Feedforward Network • Layer Normalization • Linear Layer • Mask R-CNN • Multi-Head Attention • Position-Wise Feed-Forward Layer • RoIAlign • RoIPool • RPN • Scaled Dot-Product Attention • Softmax • Sparse R-CNN • Transformer • Vision Transformer

Edit Social Preview

Instances as Queries

Code Edit Add Remove Mark official

Tasks Edit Add Remove

Datasets Edit

Results from the Paper Edit

Methods Edit Add Remove

Code

Add Remove Mark official

Tasks

Add Remove

Datasets

Results from the Paper

Edit

Methods

Add Remove