OpenCodePapers

zero-shot-transfer-image-classification-on-3

Zero-Shot Transfer Image Classification

Results over time

Click legend items to toggle metrics. Hover points for model names.

Leaderboard

Paper	Code	Accuracy (Private)	Accuracy (Public)	ModelName	ReleaseDate
[]()		81.2		BASIC (Lion)
Scaling Vision Transformers to 22 Billion Parameters	✓ Link	80.9		LiT-22B	2023-02-10
CoCa: Contrastive Captioners are Image-Text Foundation Models	✓ Link	80.7		CoCa	2022-05-04
Combined Scaling for Zero-shot Transfer Learning		80.6		BASIC	2021-11-19
PaLI: A Jointly-Scaled Multilingual Language-Image Model	✓ Link	80.6		LiT ViT-e	2022-09-14
LiT: Zero-Shot Transfer with Locked-image text Tuning	✓ Link	78.7	66.6	LiT-tuning	2021-11-15
EVA-CLIP-18B: Scaling CLIP to 18 Billion Parameters	✓ Link	77.9		EVA-CLIP-18B	2024-02-06
InternVL: Scaling up Vision Foundation Models and Aligning for Generic Visual-Linguistic Tasks	✓ Link	77.3		InternVL-C	2023-12-21
EVA-CLIP: Improved Training Techniques for CLIP at Scale	✓ Link	75.7		EVA-CLIP-E/14+	2023-03-27
Scaling Up Visual and Vision-Language Representation Learning With Noisy Text Supervision	✓ Link	70.1	-	ALIGN	2021-02-11
Learning Transferable Visual Models From Natural Language Supervision	✓ Link	70.1	-	CLIP	2021-02-26
AltCLIP: Altering the Language Encoder in CLIP for Extended Language Capabilities	✓ Link	68.1		AltCLIP	2022-11-12
PaLI: A Jointly-Scaled Multilingual Language-Image Model	✓ Link	64.46		PaLI	2022-09-14