question-answering-on-drop

Question Answering

Results over time

Click legend items to toggle metrics. Hover points for model names.

Leaderboard

Paper	Accuracy	ModelName	ReleaseDate
Large Language Models Can Self-Improve	83	PaLM 540B (Self Improvement, Self Consistency)	2022-10-20
Large Language Models Can Self-Improve	78.2	PaLM 540B (Self Consistency)	2022-10-20
Large Language Models Can Self-Improve	76.2	PaLM 540B (Self Improvement, CoT Prompting)	2022-10-20
Large Language Models Can Self-Improve	71.7	PaLM 540B (Self Improvement, Standard-Prompting)	2022-10-20
Large Language Models Can Self-Improve	70.6	PaLM 540B (CoT Prompting)	2022-10-20
Large Language Models Can Self-Improve	60	PaLM 540B (Standard-Prompting)	2022-10-20

OpenCodePapers