OpenCodePapers

referring-expression-segmentation-on-refcocog-1

Referring Expression Segmentation

Results over time

Click legend items to toggle metrics. Hover points for model names.

Leaderboard

Paper	Code	Overall IoU	Mean IoU	mIoU	ModelName	ReleaseDate
Universal Segmentation at Arbitrary Granularity with Language Instruction	✓ Link	80.54			UniLSeg-100	2023-12-04
Multi-label Cluster Discrimination for Visual Representation Learning	✓ Link	80.5			MLCD-Seg-7B	2024-07-24
Universal Segmentation at Arbitrary Granularity with Language Instruction	✓ Link	79.47			UniLSeg-20	2023-12-04
HyperSeg: Towards Universal Visual Segmentation with Large Language Model	✓ Link	78.9			HyperSeg	2024-11-26
EVF-SAM: Early Vision-Language Fusion for Text-Prompted Segment Anything Model	✓ Link	78.3			EVF-SAM	2024-06-28
Multi-task Visual Grounding with Coarse-to-Fine Consistency Constraints	✓ Link	76.39			C3VG	2025-01-12
Densely Connected Parameter-Efficient Tuning for Referring Image Segmentation	✓ Link	75.3			DETRIS	2025-01-15
GROUNDHOG: Grounding Large Language Models to Holistic Segmentation		74.6			GROUNDHOG	2024-02-26
MaskRIS: Semantic Distortion-aware Data Augmentation for Referring Image Segmentation	✓ Link	71.09			MaskRIS (Swin-B, combined DB)	2024-11-28
SafaRi:Adaptive Sequence Transformer for Weakly Supervised Referring Expression Segmentation		71.06			SafaRi-B	2024-07-02
PolyFormer: Referring Image Segmentation as Sequential Polygon Generation	✓ Link	70.19	71.17		PolyFormer-L	2023-02-14
PolyFormer: Referring Image Segmentation as Sequential Polygon Generation	✓ Link	69.05	69.88		PolyFormer-B	2023-02-14
MaskRIS: Semantic Distortion-aware Data Augmentation for Referring Image Segmentation	✓ Link	66.5	69.42		MaskRIS (Swin-B)	2024-11-28
Mask Grounding for Referring Image Segmentation	✓ Link	66.03			MagNet	2023-12-19
LAVT: Language-Aware Vision Transformer for Referring Image Segmentation	✓ Link	62.09			LAVT (Swin-B)	2021-12-04
Vision-Language Transformer and Query Generation for Referring Segmentation	✓ Link	56.65			VLT (Darknet53)	2021-08-12
DeRIS: Decoupling Perception and Cognition for Enhanced Referring Image Segmentation through Loopback Synergy	✓ Link		81.32		DeRIS-L	2025-07-02
Vision-Aware Text Features in Referring Image Segmentation: From Object Understanding to Context Understanding	✓ Link			70.58	VATEX	2024-04-12