gtzan_music_speech

gtzan_music_speech is a dataset for music/speech discrimination. It consists of 120 tracks of 30 second length. Each class (music/speech) has 60 samples. The tracks are all 22050Hz Mono 16-bit audio files in .wav format.

Homepage

Benchmarks

Add a new result Link an existing benchmark

No benchmarks yet. Start a new benchmark or link an existing one.

Papers

Paper	Code	Results	Date	Stars

Dataset Loaders

Add Remove

activeloopai/Hub

7,705

tensorflow/datasets

4,175

Tasks

Similar Datasets

Tennessee Eastman Process

PIE

Office-Caltech-10

GTZAN

Usage

License

Unknown

Modalities

Audio

gtzan_music_speech

Benchmarks Edit Add a new result Link an existing benchmark

Papers

Dataset Loaders Edit Add Remove

Tasks Edit

Similar Datasets

Tennessee Eastman Process

PIE

Office-Caltech-10

GTZAN

Usage

License Edit

Modalities Edit

Languages Edit

Benchmarks

Add a new result Link an existing benchmark

Dataset Loaders

Add Remove

Tasks

License

Modalities

Languages