MusicCaps

Introduced by Agostinelli et al. in MusicLM: Generating Music From Text

MusicCaps is a dataset composed of 5.5k music-text pairs, with rich text descriptions provided by human experts. For each 10-second music clip, MusicCaps provides:

1) A free-text caption consisting of four sentences on average, describing the music and

2) A list of music aspects, describing genre, mood, tempo, singer voices, instrumentation, dissonances, rhythm, etc.

Source: MusicLM: Generating Music From Text

Homepage

Benchmarks

Add a new result Link an existing benchmark

Trend	Task	Dataset Variant	Best Model	Paper	Code
	Text-to-Music Generation	MusicCaps	JEN-1

Papers

Paper	Code	Results	Date	Stars

Dataset Loaders

Add Remove

huggingface/datasets

18,406

Tasks

Text-to-Music Generation
Music Generation

Similar Datasets

DISCO-10M

MusicQA

MusicBench

Song Describer Dataset

Usage

MusicCaps

Benchmarks Edit Add a new result Link an existing benchmark

Papers

Dataset Loaders Edit Add Remove

Tasks Edit

Similar Datasets

DISCO-10M

MusicQA

MusicBench

Song Describer Dataset

Usage

License Edit

Modalities Edit

Languages Edit

Benchmarks

Add a new result Link an existing benchmark

Dataset Loaders

Add Remove

Tasks

License

Modalities

Languages