visual-question-answering-vqa-on-3

Visual Question Answering (VQA)

Results over time

Click legend items to toggle metrics. Hover points for model names.

Leaderboard

Paper	Code	Question Pair Acc	Question Pair Acc	ModelName	ReleaseDate
HallusionBench: An Advanced Diagnostic Suite for Entangled Language Hallucination and Visual Illusion in Large Vision-Language Models	✓ Link	12.2047		GPT-4V	2023-10-23
[]()		4.3307		LLaVA-1.5
Mitigating Hallucination in Large Multi-Modal Models via Robust Instruction Tuning	✓ Link	1.57		LRV-Instruct	2023-06-26
mPLUG-Owl: Modularization Empowers Large Language Models with Multimodality	✓ Link		2.36	mPLUG-Owl	2023-04-27

OpenCodePapers