OpenCodePapers

referring-expression-generation-on-coloninst

Referring expression generation

Results over time

Click legend items to toggle metrics. Hover points for model names.

Leaderboard

Paper	Code	Accuray	ModelName	ReleaseDate
Frontiers in Intelligent Colonoscopy	✓ Link	99.96	ColonGPT (w/ LoRA, w/o extra data)	2024-10-22
Improved Baselines with Visual Instruction Tuning	✓ Link	99.32	LLaVA-v1.5 (w/ LoRA, w/ extra data)	2023-10-05
LLaVA-Med: Training a Large Language-and-Vision Assistant for Biomedicine in One Day	✓ Link	99.3	LLaVA-Med-v1.5 (w/ LoRA, w/o extra data)	2023-06-01
Mini-Gemini: Mining the Potential of Multi-modality Vision Language Models	✓ Link	98.75	MGM-2B (w/o LoRA, w/ extra data)	2024-03-27
Improved Baselines with Visual Instruction Tuning	✓ Link	98.58	LLaVA-v1.5 (w/ LoRA, w/o extra data)	2023-10-05
Mini-Gemini: Mining the Potential of Multi-modality Vision Language Models	✓ Link	98.17	MGM-2B (w/o LoRA, w/o extra data)	2024-03-27
MobileVLM : A Fast, Strong and Open Vision Language Assistant for Mobile Devices	✓ Link	97.87	MobileVLM-1.7B (w/ LoRA, w/ extra data)	2023-12-28
MobileVLM : A Fast, Strong and Open Vision Language Assistant for Mobile Devices	✓ Link	97.78	MobileVLM-1.7B (w/o LoRA, w/ extra data)	2023-12-28
LLaVA-Med: Training a Large Language-and-Vision Assistant for Biomedicine in One Day	✓ Link	97.74	LLaVA-Med-v1.0 (w/o LoRA, w/o extra data)	2023-06-01
LLaVA-Med: Training a Large Language-and-Vision Assistant for Biomedicine in One Day	✓ Link	97.35	LLaVA-Med-v1.0 (w/o LoRA, w/ extra data)	2023-06-01
Efficient Multimodal Learning from Data-centric Perspective	✓ Link	96.61	Bunny-v1.0-3B (w/ LoRA, w/o extra data)	2024-02-18
Efficient Multimodal Learning from Data-centric Perspective	✓ Link	96.02	Bunny-v1.0-3B (w/ LoRA, w/ extra data)	2024-02-18
MiniGPT-v2: large language model as a unified interface for vision-language multi-task learning	✓ Link	94.69	MiniGPT-v2 (w/ LoRA, w/o extra data)	2023-10-14
LLaVA-Med: Training a Large Language-and-Vision Assistant for Biomedicine in One Day	✓ Link	90.4	LLaVA-Med-v1.5 (w/ LoRA, w/ extra data)	2023-06-01
MiniGPT-v2: large language model as a unified interface for vision-language multi-task learning	✓ Link	87.65	MiniGPT-v2 (w/ LoRA, w/ extra data)	2023-10-14
Visual Instruction Tuning	✓ Link	86.87	LLaVA-v1 (w/ LoRA, w/ extra data)	2023-04-17
Visual Instruction Tuning	✓ Link	84.55	LLaVA-v1 (w/ LoRA, w/o extra data)	2023-04-17