TASK	DATASET	MODEL	METRIC NAME	METRIC VALUE	GLOBAL RANK
Prompt Engineering	Caltech-101	HPT	Harmonic mean	96.65	# 2
Prompt Engineering	DTD	HPT	Harmonic mean	72.16	# 4
Prompt Engineering	EuroSAT	HPT	Harmonic mean	84.82	# 4
Prompt Engineering	FGVC-Aircraft	HPT	Harmonic mean	40.28	# 2
Prompt Engineering	Food-101	HPT	Harmonic mean	91.01	# 7
Prompt Engineering	ImageNet	HPT	Harmonic mean	74.17	# 4
Prompt Engineering	ImageNet-A	HPT	Top-1 accuracy %	50.85	# 4
Prompt Engineering	ImageNet-R	HPT	Top-1 accuracy %	77.38	# 4
Prompt Engineering	ImageNet-S	HPT	Top-1 accuracy %	49.36	# 4
Prompt Engineering	ImageNet V2	HPT	Top-1 accuracy %	65.25	# 1
Prompt Engineering	Oxford 102 Flower	HPT	Harmonic mean	87.16	# 2
Prompt Engineering	Oxford-IIIT Pet Dataset	HPT	Harmonic mean	96.71	# 3
Prompt Engineering	Stanford Cars	HPT	Harmonic mean	75.57	# 5
Prompt Engineering	SUN397	HPT	Harmonic mean	80.88	# 3
Prompt Engineering	UCF101	HPT	Harmonic mean	83.16	# 3

Badge	Markdown
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/learning-hierarchical-prompt-with-structured/prompt-engineering-on-imagenet-v2)](https://paperswithcode.com/sota/prompt-engineering-on-imagenet-v2?p=learning-hierarchical-prompt-with-structured)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/learning-hierarchical-prompt-with-structured/prompt-engineering-on-caltech-101)](https://paperswithcode.com/sota/prompt-engineering-on-caltech-101?p=learning-hierarchical-prompt-with-structured)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/learning-hierarchical-prompt-with-structured/prompt-engineering-on-fgvc-aircraft)](https://paperswithcode.com/sota/prompt-engineering-on-fgvc-aircraft?p=learning-hierarchical-prompt-with-structured)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/learning-hierarchical-prompt-with-structured/prompt-engineering-on-oxford-102-flower)](https://paperswithcode.com/sota/prompt-engineering-on-oxford-102-flower?p=learning-hierarchical-prompt-with-structured)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/learning-hierarchical-prompt-with-structured/prompt-engineering-on-oxford-iiit-pet-dataset)](https://paperswithcode.com/sota/prompt-engineering-on-oxford-iiit-pet-dataset?p=learning-hierarchical-prompt-with-structured)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/learning-hierarchical-prompt-with-structured/prompt-engineering-on-sun397)](https://paperswithcode.com/sota/prompt-engineering-on-sun397?p=learning-hierarchical-prompt-with-structured)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/learning-hierarchical-prompt-with-structured/prompt-engineering-on-ucf101)](https://paperswithcode.com/sota/prompt-engineering-on-ucf101?p=learning-hierarchical-prompt-with-structured)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/learning-hierarchical-prompt-with-structured/prompt-engineering-on-dtd)](https://paperswithcode.com/sota/prompt-engineering-on-dtd?p=learning-hierarchical-prompt-with-structured)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/learning-hierarchical-prompt-with-structured/prompt-engineering-on-eurosat)](https://paperswithcode.com/sota/prompt-engineering-on-eurosat?p=learning-hierarchical-prompt-with-structured)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/learning-hierarchical-prompt-with-structured/prompt-engineering-on-imagenet)](https://paperswithcode.com/sota/prompt-engineering-on-imagenet?p=learning-hierarchical-prompt-with-structured)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/learning-hierarchical-prompt-with-structured/prompt-engineering-on-imagenet-a)](https://paperswithcode.com/sota/prompt-engineering-on-imagenet-a?p=learning-hierarchical-prompt-with-structured)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/learning-hierarchical-prompt-with-structured/prompt-engineering-on-imagenet-r)](https://paperswithcode.com/sota/prompt-engineering-on-imagenet-r?p=learning-hierarchical-prompt-with-structured)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/learning-hierarchical-prompt-with-structured/prompt-engineering-on-imagenet-s)](https://paperswithcode.com/sota/prompt-engineering-on-imagenet-s?p=learning-hierarchical-prompt-with-structured)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/learning-hierarchical-prompt-with-structured/prompt-engineering-on-stanford-cars-1)](https://paperswithcode.com/sota/prompt-engineering-on-stanford-cars-1?p=learning-hierarchical-prompt-with-structured)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/learning-hierarchical-prompt-with-structured/prompt-engineering-on-food-101)](https://paperswithcode.com/sota/prompt-engineering-on-food-101?p=learning-hierarchical-prompt-with-structured)`

Learning Hierarchical Prompt with Structured Linguistic Knowledge for Vision-Language Models

11 Dec 2023 · Yubin Wang, Xinyang Jiang, De Cheng, Dongsheng Li, Cairong Zhao ·

Prompt learning has become a prevalent strategy for adapting vision-language foundation models to downstream tasks. As large language models (LLMs) have emerged, recent studies have explored the use of category-related descriptions as input to enhance prompt effectiveness. Nevertheless, conventional descriptions fall short of structured information that effectively represents the interconnections among entities or attributes linked to a particular category. To address this limitation and prioritize harnessing structured knowledge, this paper advocates for leveraging LLMs to build a graph for each description to model the entities and attributes describing the category, as well as their correlations. Preexisting prompt tuning methods exhibit inadequacies in managing this structured knowledge. Consequently, we propose a novel approach called Hierarchical Prompt Tuning (HPT), which enables simultaneous modeling of both structured and conventional linguistic knowledge. Specifically, we introduce a relationship-guided attention module to capture pair-wise associations among entities and attributes for low-level prompt learning. In addition, by incorporating high-level and global-level prompts modeling overall semantics, the proposed hierarchical structure forges cross-level interlinks and empowers the model to handle more complex and long-term relationships. Extensive experiments demonstrate that our HPT shows strong effectiveness and generalizes much better than existing SOTA methods. Our code is available at https://github.com/Vill-Lab/2024-AAAI-HPT.

PDF Abstract

Code

Add Remove Mark official

vill-lab/2024-aaai-hpt official

Tasks

Add Remove

Prompt Engineering

Datasets

ImageNet

UCF101

Oxford 102 Flower

Stanford Cars

DTD

Food-101

Caltech-101

EuroSAT

FGVC-Aircraft

ImageNet-R

ImageNet-A

Oxford-IIIT Pet Dataset Oxford-IIIT Pets

SUN397

ImageNet-S

Results from the Paper

Edit

Ranked #1 on Prompt Engineering on ImageNet V2

Get a GitHub badge

Task	Dataset	Model	Metric Name	Metric Value	Global Rank	Benchmark
Prompt Engineering	Caltech-101	HPT	Harmonic mean	96.65	# 2	Compare
Prompt Engineering	DTD	HPT	Harmonic mean	72.16	# 4	Compare
Prompt Engineering	EuroSAT	HPT	Harmonic mean	84.82	# 4	Compare
Prompt Engineering	FGVC-Aircraft	HPT	Harmonic mean	40.28	# 2	Compare
Prompt Engineering	Food-101	HPT	Harmonic mean	91.01	# 7	Compare
Prompt Engineering	ImageNet	HPT	Harmonic mean	74.17	# 4	Compare
Prompt Engineering	ImageNet-A	HPT	Top-1 accuracy %	50.85	# 4	Compare
Prompt Engineering	ImageNet-R	HPT	Top-1 accuracy %	77.38	# 4	Compare
Prompt Engineering	ImageNet-S	HPT	Top-1 accuracy %	49.36	# 4	Compare
Prompt Engineering	ImageNet V2	HPT	Top-1 accuracy %	65.25	# 1	Compare
Prompt Engineering	Oxford 102 Flower	HPT	Harmonic mean	87.16	# 2	Compare
Prompt Engineering	Oxford-IIIT Pet Dataset	HPT	Harmonic mean	96.71	# 3	Compare
Prompt Engineering	Stanford Cars	HPT	Harmonic mean	75.57	# 5	Compare
Prompt Engineering	SUN397	HPT	Harmonic mean	80.88	# 3	Compare
Prompt Engineering	UCF101	HPT	Harmonic mean	83.16	# 3	Compare

Methods

Add Remove

No methods listed for this paper. Add relevant methods here

Edit Social Preview

Learning Hierarchical Prompt with Structured Linguistic Knowledge for Vision-Language Models

Code Edit Add Remove Mark official

Tasks Edit Add Remove

Datasets Edit

Results from the Paper Edit

Methods Edit Add Remove

Code

Add Remove Mark official

Tasks

Add Remove

Datasets

Results from the Paper

Edit

Methods

Add Remove