OpenCodePapers

audio-tagging-on-audioset

Audio Tagging

Results over time

Click legend items to toggle metrics. Hover points for model names.

Leaderboard

Paper	Code	mean average precision	ModelName	ReleaseDate
Contrastive Audio-Visual Masked Autoencoder	✓ Link	0.512	CAV-MAE (Audio-Visual)	2022-10-02
Efficient Large-scale Audio Tagging via Transformer-to-CNN Knowledge Distillation	✓ Link	0.498	mn40_as (Ensemble)	2022-11-09
Efficient Training of Audio Transformers with Patchout	✓ Link	0.496	PaSST	2021-10-11
Dynamic Convolutional Neural Networks as Efficient Pre-trained Audio Models	✓ Link	0.490	DyMN-L (Audio-Only, Single)	2023-10-24
AST: Audio Spectrogram Transformer	✓ Link	0.485	Audio Spectrogram Transformer	2021-04-05
Efficient Large-scale Audio Tagging via Transformer-to-CNN Knowledge Distillation	✓ Link	0.483	mn40_as (Single)	2022-11-09
PSLA: Improving Audio Tagging with Pretraining, Sampling, Labeling, and Aggregation	✓ Link	0.474	PSLA	2021-02-02
Zero-shot Audio Source Separation through Query-based Learning from Weakly-labeled Data	✓ Link	0.467	ST-SED	2021-12-15
Contrastive Audio-Visual Masked Autoencoder	✓ Link	0.466	CAV-MAE (Audio-Only)	2022-10-02
ERANNs: Efficient Residual Audio Neural Networks for Audio Pattern Recognition		0.450	ERANN-1-6	2021-06-03
PANNs: Large-Scale Pretrained Audio Neural Networks for Audio Pattern Recognition	✓ Link	0.431	CNN14	2020-08-23