Audio

97 benchmarks • 71 tasks • 159 datasets • 1380 papers with code

Classification

Classification

3246 papers with code

Text Classification

1104 papers with code

Graph Classification

380 papers with code

Audio Classification

131 papers with code

Medical Image Classification

122 papers with code

See all 19 tasks

2D Semantic Segmentation

Image Segmentation

1494 papers with code

Text Style Transfer

80 papers with code

Scene Parsing

75 papers with code

2D Semantic Segmentation

38 papers with code

Reflection Removal

29 papers with code

See all 14 tasks

Speech Recognition

Speech Recognition

1090 papers with code

Automatic Speech Recognition (ASR)

481 papers with code

Visual Speech Recognition

40 papers with code

Robust Speech Recognition

22 papers with code

Distant Speech Recognition

10 papers with code

See all 11 tasks

Few-Shot Learning

Few-Shot Learning

1037 papers with code

One-Shot Learning

93 papers with code

Few-Shot Semantic Segmentation

74 papers with code

Cross-Domain Few-Shot

55 papers with code

Unsupervised Few-Shot Learning

12 papers with code

See all 13 tasks

Emotion Recognition

Emotion Recognition

458 papers with code

Speech Emotion Recognition

98 papers with code

Emotion Recognition in Conversation

72 papers with code

Multimodal Emotion Recognition

53 papers with code

Emotion-Cause Pair Extraction

19 papers with code

See all 13 tasks

Conformal Prediction

147 papers with code

Text Simplification

117 papers with code

Music Source Separation

53 papers with code

Audio Source Separation

44 papers with code

Decision Making Under Uncertainty

44 papers with code

See all 9 tasks

Speech Synthesis

Speech Synthesis

290 papers with code

Expressive Speech Synthesis

11 papers with code

Emotional Speech Synthesis

3 papers with code

text-to-speech translation

2 papers with code

Speech Synthesis - Assamese

1 papers with code

See all 16 tasks

Accented Speech Recognition

Speech Synthesis

290 papers with code

Speech Enhancement

Speech Enhancement

218 papers with code

Speech Dereverberation

17 papers with code

Bandwidth Extension

15 papers with code

Packet Loss Concealment

4 papers with code

Speech Intelligibility Evaluation

Language Identification

Language Identification

123 papers with code

Dialect Identification

32 papers with code

Native Language Identification

5 papers with code

Audio Classification

Audio Classification

131 papers with code

Environmental Sound Classification

23 papers with code

Audio Multiple Target Classification

1 papers with code

Semi-supervised Audio Classification

1 papers with code

Voice Conversion

Voice Conversion

149 papers with code

DeepFake Detection

DeepFake Detection

129 papers with code

Synthetic Speech Detection

8 papers with code

Human Detection of Deepfakes

1 papers with code

Multimodal Forgery Detection

1 papers with code

Music Generation

Music Generation

129 papers with code

Music Performance Rendering

4 papers with code

Music Texture Transfer

1 papers with code

Audio Generation

Audio Generation

64 papers with code

Voice Cloning

17 papers with code

Audio Super-Resolution

14 papers with code

Room Impulse Response (RIR)

9 papers with code

Text-To-Speech Synthesis

Text-To-Speech Synthesis

92 papers with code

Prosody Prediction

2 papers with code

Zero-Shot Multi-Speaker TTS

2 papers with code

Audio Signal Processing

blind source separation

44 papers with code

Audio Signal Processing

20 papers with code

Audio Compression

12 papers with code

Audio Effects Modeling

2 papers with code

Sound Event Detection

Sound Event Detection

74 papers with code

Audio Source Separation

Audio Source Separation

44 papers with code

Target Sound Extraction

4 papers with code

Directional Hearing

1 papers with code

Single-Label Target Sound Extraction

Sound Classification

Sound Classification

46 papers with code

Audio Tagging

Audio Tagging

41 papers with code

Audio captioning

Audio captioning

39 papers with code

Zero-shot Audio Captioning

1 papers with code

Acoustic Scene Classification

Acoustic Scene Classification

37 papers with code

Sound Event Localization and Detection

Sound Event Localization and Detection

28 papers with code

Environmental Sound Classification

Environmental Sound Classification

23 papers with code

Self-Supervised Sound Classification

1 papers with code

Instrument Recognition

Instrument Recognition

20 papers with code

Text-to-Music Generation

Text-to-Music Generation

13 papers with code

Direction of Arrival Estimation

Direction of Arrival Estimation

12 papers with code

Voice Anti-spoofing

Voice Anti-spoofing

12 papers with code

Audio inpainting

Audio inpainting

11 papers with code

Instance Search

Instance Search

9 papers with code

Audio Fingerprint

1 papers with code

Audio Denoising

Audio Denoising

9 papers with code

Online Beat Tracking

Inference Optimization

9 papers with code

Audio-Visual Synchronization

Audio-Visual Synchronization

8 papers with code

Chord Recognition

Chord Recognition

7 papers with code

Bird Classification

Bird Audio Detection

3 papers with code

Bird Classification

Bird Species Classification With Audio-Visual Data

Audio Effects Modeling

Pitch control

2 papers with code

Timbre Interpolation

1 papers with code

Audio declipping

Audio declipping

3 papers with code

Music Compression

Music Compression

3 papers with code

Visually Guided Sound Source Separation

Visually Guided Sound Source Separation

3 papers with code

Vowel Classification

Vowel Classification

3 papers with code

Hearing Aid and device processing

Cadenza 1 - Task 1 - Headphone

1 papers with code

Cadenza 1 - Task 2 - In Car

1 papers with code

Hearing Aid and device processing

Audio Signal Recognition

Audio Signal Recognition

1 papers with code

Gunshot Detection

1 papers with code

fake voice detection

fake voice detection

2 papers with code

Acoustic Novelty Detection

Acoustic Novelty Detection

1 papers with code

Audio Dequantization

Audio Dequantization

1 papers with code

Directional Hearing

Real-time Directional Hearing

1 papers with code

Music Quality Assessment

Music Quality Assessment

1 papers with code

Shooter Localization

Shooter Localization

1 papers with code

Soundscape evaluation

Soundscape evaluation

1 papers with code

Speaker Orientation

Speaker Orientation

1 papers with code

Target Sound Extraction

Streaming Target Sound Extraction

1 papers with code

Active Speaker Localization

Active Speaker Localization