TASK	DATASET	MODEL	METRIC NAME	METRIC VALUE	GLOBAL RANK
Prompt Engineering	Caltech-101	MetaPrompt	Harmonic mean	96.32	# 4
Prompt Engineering	DTD	MetaPrompt	Harmonic mean	68.35	# 7
Prompt Engineering	EuroSAT	MetaPrompt	Harmonic mean	83.38	# 5
Prompt Engineering	FGVC-Aircraft	MetaPrompt	Harmonic mean	38.24	# 6
Prompt Engineering	Food-101	MetaPrompt	Harmonic mean	91.29	# 5
Prompt Engineering	ImageNet	MetaPrompt	Harmonic mean	74.02	# 6
Prompt Engineering	Oxford 102 Flower	MetaPrompt	Harmonic mean	84.52	# 6
Prompt Engineering	Oxford-IIIT Pet Dataset	MetaPrompt	Harmonic mean	96.26	# 8
Prompt Engineering	Stanford Cars	MetaPrompt	Harmonic mean	75.48	# 6
Prompt Engineering	SUN397	MetaPrompt	Harmonic mean	80.62	# 5
Prompt Engineering	UCF101	MetaPrompt	Harmonic mean	81.35	# 6

Badge	Markdown
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/learning-domain-invariant-prompt-for-vision/prompt-engineering-on-caltech-101)](https://paperswithcode.com/sota/prompt-engineering-on-caltech-101?p=learning-domain-invariant-prompt-for-vision)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/learning-domain-invariant-prompt-for-vision/prompt-engineering-on-eurosat)](https://paperswithcode.com/sota/prompt-engineering-on-eurosat?p=learning-domain-invariant-prompt-for-vision)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/learning-domain-invariant-prompt-for-vision/prompt-engineering-on-food-101)](https://paperswithcode.com/sota/prompt-engineering-on-food-101?p=learning-domain-invariant-prompt-for-vision)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/learning-domain-invariant-prompt-for-vision/prompt-engineering-on-sun397)](https://paperswithcode.com/sota/prompt-engineering-on-sun397?p=learning-domain-invariant-prompt-for-vision)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/learning-domain-invariant-prompt-for-vision/prompt-engineering-on-fgvc-aircraft)](https://paperswithcode.com/sota/prompt-engineering-on-fgvc-aircraft?p=learning-domain-invariant-prompt-for-vision)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/learning-domain-invariant-prompt-for-vision/prompt-engineering-on-imagenet)](https://paperswithcode.com/sota/prompt-engineering-on-imagenet?p=learning-domain-invariant-prompt-for-vision)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/learning-domain-invariant-prompt-for-vision/prompt-engineering-on-oxford-102-flower)](https://paperswithcode.com/sota/prompt-engineering-on-oxford-102-flower?p=learning-domain-invariant-prompt-for-vision)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/learning-domain-invariant-prompt-for-vision/prompt-engineering-on-stanford-cars-1)](https://paperswithcode.com/sota/prompt-engineering-on-stanford-cars-1?p=learning-domain-invariant-prompt-for-vision)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/learning-domain-invariant-prompt-for-vision/prompt-engineering-on-ucf101)](https://paperswithcode.com/sota/prompt-engineering-on-ucf101?p=learning-domain-invariant-prompt-for-vision)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/learning-domain-invariant-prompt-for-vision/prompt-engineering-on-dtd)](https://paperswithcode.com/sota/prompt-engineering-on-dtd?p=learning-domain-invariant-prompt-for-vision)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/learning-domain-invariant-prompt-for-vision/prompt-engineering-on-oxford-iiit-pet-dataset)](https://paperswithcode.com/sota/prompt-engineering-on-oxford-iiit-pet-dataset?p=learning-domain-invariant-prompt-for-vision)`

Learning Domain Invariant Prompt for Vision-Language Models

8 Dec 2022 · Cairong Zhao, Yubin Wang, Xinyang Jiang, Yifei Shen, Kaitao Song, Dongsheng Li, Duoqian Miao ·

Prompt learning is one of the most effective and trending ways to adapt powerful vision-language foundation models like CLIP to downstream datasets by tuning learnable prompt vectors with very few samples. However, although prompt learning achieves excellent performance over in-domain data, it still faces the major challenge of generalizing to unseen classes and domains. Some existing prompt learning methods tackle this issue by adaptively generating different prompts for different tokens or domains but neglecting the ability of learned prompts to generalize to unseen domains. In this paper, we propose a novel prompt learning paradigm that directly generates \emph{domain invariant} prompt that can be generalized to unseen domains, called MetaPrompt. Specifically, a dual-modality prompt tuning network is proposed to generate prompts for input from both image and text modalities. With a novel asymmetric contrastive loss, the representation from the original pre-trained vision-language model acts as supervision to enhance the generalization ability of the learned prompt. More importantly, we propose a meta-learning-based prompt tuning algorithm that explicitly constrains the task-specific prompt tuned for one domain or class to also achieve good performance in another domain or class. Extensive experiments on 11 datasets for base-to-new generalization and 4 datasets for domain generalization demonstrate that our method consistently and significantly outperforms existing methods.

PDF Abstract

Code

Add Remove Mark official

Vill-Lab/2024-TIP-MetaPrompt

Tasks

Add Remove

Domain Generalization

Language Modelling

Meta-Learning

Prompt Engineering

Datasets

ImageNet

UCF101

Oxford 102 Flower

Office-Home

Stanford Cars

DTD

DomainNet

Food-101

Caltech-101

PACS

EuroSAT

FGVC-Aircraft

Oxford-IIIT Pet Dataset Oxford-IIIT Pets

SUN397

Results from the Paper

Edit

Ranked #4 on Prompt Engineering on Caltech-101

Get a GitHub badge

Task	Dataset	Model	Metric Name	Metric Value	Global Rank	Benchmark
Prompt Engineering	Caltech-101	MetaPrompt	Harmonic mean	96.32	# 4	Compare
Prompt Engineering	DTD	MetaPrompt	Harmonic mean	68.35	# 7	Compare
Prompt Engineering	EuroSAT	MetaPrompt	Harmonic mean	83.38	# 5	Compare
Prompt Engineering	FGVC-Aircraft	MetaPrompt	Harmonic mean	38.24	# 6	Compare
Prompt Engineering	Food-101	MetaPrompt	Harmonic mean	91.29	# 5	Compare
Prompt Engineering	ImageNet	MetaPrompt	Harmonic mean	74.02	# 6	Compare
Prompt Engineering	Oxford 102 Flower	MetaPrompt	Harmonic mean	84.52	# 6	Compare
Prompt Engineering	Oxford-IIIT Pet Dataset	MetaPrompt	Harmonic mean	96.26	# 8	Compare
Prompt Engineering	Stanford Cars	MetaPrompt	Harmonic mean	75.48	# 6	Compare
Prompt Engineering	SUN397	MetaPrompt	Harmonic mean	80.62	# 5	Compare
Prompt Engineering	UCF101	MetaPrompt	Harmonic mean	81.35	# 6	Compare

Methods

Add Remove

CLIP

Edit Social Preview

Learning Domain Invariant Prompt for Vision-Language Models

Code Edit Add Remove Mark official

Tasks Edit Add Remove

Datasets Edit

Results from the Paper Edit

Methods Edit Add Remove

Code

Add Remove Mark official

Tasks

Add Remove

Datasets

Results from the Paper

Edit

Methods

Add Remove