human-judgment-correlation-on-flickr8k-expert

Human Judgment Correlation

Results over time

Click legend items to toggle metrics. Hover points for model names.

Leaderboard

Paper	Code	Kendall's Tau-c	ModelName	ReleaseDate
Mutual Information Divergence: A Unified Metric for Multimodal Generative Models	✓ Link	54.9	MID	2022-05-25
FACTUAL: A Benchmark for Faithful and Consistent Textual Scene Graph Parsing	✓ Link	54.2	SoftSPICE	2023-05-27
CLIPScore: A Reference-free Evaluation Metric for Image Captioning	✓ Link	53.0	RefCLIP-S	2021-04-18
CLIPScore: A Reference-free Evaluation Metric for Image Captioning	✓ Link	51.2	CLIP-S	2021-04-18

OpenCodePapers