multiple-choice-question-answering-mcqa-on-21

Question AnsweringMultiple Choice Question Answering (MCQA)

Results over time

Click legend items to toggle metrics. Hover points for model names.

Leaderboard

Paper	Code	Test Set (Acc-%)	Dev Set (Acc-%)	ModelName	ReleaseDate
Towards Expert-Level Medical Question Answering with Large Language Models	✓ Link	0.723		Med-PaLM 2 (ER)	2023-05-16
Towards Expert-Level Medical Question Answering with Large Language Models	✓ Link	0.715		Med-PaLM 2 (CoT+SC)	2023-05-16
Towards Expert-Level Medical Question Answering with Large Language Models	✓ Link	0.713		Med-PaLM 2 (5-shot)	2023-05-16
Variational Open-Domain Question Answering	✓ Link	0.629	0.583	VOD (BioLinkBERT)	2022-09-23
Can large language models reason about medical questions?	✓ Link	0.627	0.597	Codex 5-shot CoT	2022-07-17
BioMedGPT: Open Multimodal Generative Pre-trained Transformer for BioMedicine	✓ Link	0.514		BioMedGPT-10B	2023-08-18
MedMCQA : A Large-scale Multi-Subject Multi-Choice Dataset for Medical domain Question Answering	✓ Link	0.41	0.40	PubmedBERT(Gu et al., 2022)	2022-03-27
MedMCQA : A Large-scale Multi-Subject Multi-Choice Dataset for Medical domain Question Answering	✓ Link	0.39	0.39	SciBERT (Beltagy et al., 2019)	2022-03-27
MedMCQA : A Large-scale Multi-Subject Multi-Choice Dataset for Medical domain Question Answering	✓ Link	0.37	0.38	BioBERT (Lee et al.,2020)	2022-03-27
MedMCQA : A Large-scale Multi-Subject Multi-Choice Dataset for Medical domain Question Answering	✓ Link	0.33	0.35	BERT (Devlin et al., 2019)-Base	2022-03-27
MEDITRON-70B: Scaling Medical Pretraining for Large Language Models	✓ Link		66.0	Meditron-70B (CoT + SC)	2023-11-27
Large Language Models Encode Clinical Knowledge	✓ Link		0.576	Flan-PaLM (540B, SC)	2022-12-26
Large Language Models Encode Clinical Knowledge	✓ Link		0.565	Flan-PaLM (540B, Few-shot)	2022-12-26
Large Language Models Encode Clinical Knowledge	✓ Link		0.545	PaLM (540B, Few-shot)	2022-12-26
Large Language Models Encode Clinical Knowledge	✓ Link		0.536	Flan-PaLM (540B, CoT)	2022-12-26
Galactica: A Large Language Model for Science	✓ Link		0.529	GAL 120B (zero-shot)	2022-11-16
Large Language Models Encode Clinical Knowledge	✓ Link		0.462	Flan-PaLM (62B, Few-shot)	2022-12-26
Large Language Models Encode Clinical Knowledge	✓ Link		0.434	PaLM (62B, Few-shot)	2022-12-26
Large Language Models Encode Clinical Knowledge	✓ Link		0.345	Flan-PaLM (8B, Few-shot)	2022-12-26
Galactica: A Large Language Model for Science	✓ Link		0.325	BLOOM (few-shot, k=5)	2022-11-16
Galactica: A Large Language Model for Science	✓ Link		0.296	OPT (few-shot, k=5)	2022-11-16
Large Language Models Encode Clinical Knowledge	✓ Link		0.267	PaLM (8B, Few-shot)	2022-12-26

OpenCodePapers

multiple-choice-question-answering-mcqa-on-21