TASK	DATASET	MODEL	METRIC NAME	METRIC VALUE	GLOBAL RANK
Image Quality Assessment	MSU NR VQA Database	MUSIQ	SRCC	0.9004	# 3
Image Quality Assessment	MSU NR VQA Database	MUSIQ	PLCC	0.9068	# 3
Image Quality Assessment	MSU NR VQA Database	MUSIQ	KLCC	0.7433	# 3
Video Quality Assessment	MSU NR VQA Database	MUSIQ	SRCC	0.9004	# 7
Video Quality Assessment	MSU NR VQA Database	MUSIQ	PLCC	0.9068	# 8
Video Quality Assessment	MSU NR VQA Database	MUSIQ	KLCC	0.7433	# 7
Video Quality Assessment	MSU NR VQA Database	MUSIQ	Type	NR	# 1
Video Quality Assessment	MSU SR-QA Dataset	MUSIQ trained on PaQ-2-PiQ	SROCC	0.67746	# 6
Video Quality Assessment	MSU SR-QA Dataset	MUSIQ trained on PaQ-2-PiQ	PLCC	0.66531	# 6
Video Quality Assessment	MSU SR-QA Dataset	MUSIQ trained on PaQ-2-PiQ	KLCC	0.55312	# 6
Video Quality Assessment	MSU SR-QA Dataset	MUSIQ trained on PaQ-2-PiQ	Type	NR	# 1
Video Quality Assessment	MSU SR-QA Dataset	MUSIQ trained on AVA	SROCC	0.56152	# 26
Video Quality Assessment	MSU SR-QA Dataset	MUSIQ trained on AVA	PLCC	0.52404	# 33
Video Quality Assessment	MSU SR-QA Dataset	MUSIQ trained on AVA	KLCC	0.44669	# 26
Video Quality Assessment	MSU SR-QA Dataset	MUSIQ trained on AVA	Type	NR	# 1
Video Quality Assessment	MSU SR-QA Dataset	MUSIQ trained on KONIQ	SROCC	0.64589	# 12
Video Quality Assessment	MSU SR-QA Dataset	MUSIQ trained on KONIQ	PLCC	0.59151	# 17
Video Quality Assessment	MSU SR-QA Dataset	MUSIQ trained on KONIQ	KLCC	0.51897	# 14
Video Quality Assessment	MSU SR-QA Dataset	MUSIQ trained on KONIQ	Type	NR	# 1
Video Quality Assessment	MSU SR-QA Dataset	MUSIQ trained on SPAQ	SROCC	0.64927	# 10
Video Quality Assessment	MSU SR-QA Dataset	MUSIQ trained on SPAQ	PLCC	0.60216	# 15
Video Quality Assessment	MSU SR-QA Dataset	MUSIQ trained on SPAQ	KLCC	0.52673	# 10
Video Quality Assessment	MSU SR-QA Dataset	MUSIQ trained on SPAQ	Type	NR	# 1

Badge	Markdown
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/musiq-multi-scale-image-quality-transformer/image-quality-assessment-on-msu-nr-vqa)](https://paperswithcode.com/sota/image-quality-assessment-on-msu-nr-vqa?p=musiq-multi-scale-image-quality-transformer)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/musiq-multi-scale-image-quality-transformer/video-quality-assessment-on-msu-sr-qa-dataset)](https://paperswithcode.com/sota/video-quality-assessment-on-msu-sr-qa-dataset?p=musiq-multi-scale-image-quality-transformer)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/musiq-multi-scale-image-quality-transformer/video-quality-assessment-on-msu-video-quality)](https://paperswithcode.com/sota/video-quality-assessment-on-msu-video-quality?p=musiq-multi-scale-image-quality-transformer)`

MUSIQ: Multi-scale Image Quality Transformer

ICCV 2021 · Junjie Ke, Qifei Wang, Yilin Wang, Peyman Milanfar, Feng Yang ·

Image quality assessment (IQA) is an important research topic for understanding and improving visual experience. The current state-of-the-art IQA methods are based on convolutional neural networks (CNNs). The performance of CNN-based models is often compromised by the fixed shape constraint in batch training. To accommodate this, the input images are usually resized and cropped to a fixed shape, causing image quality degradation. To address this, we design a multi-scale image quality Transformer (MUSIQ) to process native resolution images with varying sizes and aspect ratios. With a multi-scale image representation, our proposed method can capture image quality at different granularities. Furthermore, a novel hash-based 2D spatial embedding and a scale embedding is proposed to support the positional embedding in the multi-scale representation. Experimental results verify that our method can achieve state-of-the-art performance on multiple large scale IQA datasets such as PaQ-2-PiQ, SPAQ and KonIQ-10k.

PDF Abstract ICCV 2021 PDF ICCV 2021 Abstract

Code

Add Remove Mark official

google-research/google-research official

32,804

anse3832/MUSIQ

Tasks

Add Remove

Image Quality Assessment

Video Quality Assessment

Datasets

ImageNet

KonIQ-10k SPAQ MSU SR-QA Dataset

MSU NR VQA Database

Aesthetic Visual Analysis

Results from the Paper

Edit

Ranked #3 on Image Quality Assessment on MSU NR VQA Database

Get a GitHub badge

Task	Dataset	Model	Metric Name	Metric Value	Global Rank	Benchmark
Image Quality Assessment	MSU NR VQA Database	MUSIQ	SRCC	0.9004	# 3	Compare
			PLCC	0.9068	# 3	Compare
			KLCC	0.7433	# 3	Compare
Video Quality Assessment	MSU NR VQA Database	MUSIQ	SRCC	0.9004	# 7	Compare
			PLCC	0.9068	# 8	Compare
			KLCC	0.7433	# 7	Compare
			Type	NR	# 1	Compare
Video Quality Assessment	MSU SR-QA Dataset	MUSIQ trained on PaQ-2-PiQ	SROCC	0.67746	# 6	Compare
			PLCC	0.66531	# 6	Compare
			KLCC	0.55312	# 6	Compare
			Type	NR	# 1	Compare
Video Quality Assessment	MSU SR-QA Dataset	MUSIQ trained on AVA	SROCC	0.56152	# 26	Compare
			PLCC	0.52404	# 33	Compare
			KLCC	0.44669	# 26	Compare
			Type	NR	# 1	Compare
Video Quality Assessment	MSU SR-QA Dataset	MUSIQ trained on KONIQ	SROCC	0.64589	# 12	Compare
			PLCC	0.59151	# 17	Compare
			KLCC	0.51897	# 14	Compare
			Type	NR	# 1	Compare
Video Quality Assessment	MSU SR-QA Dataset	MUSIQ trained on SPAQ	SROCC	0.64927	# 10	Compare
			PLCC	0.60216	# 15	Compare
			KLCC	0.52673	# 10	Compare
			Type	NR	# 1	Compare

Methods

Add Remove

Absolute Position Encodings • Adam • BPE • Dense Connections • Dropout • Label Smoothing • Layer Normalization • Linear Layer • Multi-Head Attention • MUSIQ • Position-Wise Feed-Forward Layer • Residual Connection • Scaled Dot-Product Attention • Softmax • Transformer

Edit Social Preview

MUSIQ: Multi-scale Image Quality Transformer

Code Edit Add Remove Mark official

Tasks Edit Add Remove

Datasets Edit

Results from the Paper Edit

Methods Edit Add Remove

Code

Add Remove Mark official

Tasks

Add Remove

Datasets

Results from the Paper

Edit

Methods

Add Remove