Position Paper On Diagnostic Uncertainty Estimation from Large Language Models: Next-Word Probability Is Not Pre-test Probability

Gao, Y.; Myers, S.; Chen, S.; Dligach, D.; Miller, T.; Bitterman, D. S.; Chen, G.; Mayampurath, A.; Churpek, M. M.; Afshar, M.

2024-11-07 health informatics

10.1101/2024.11.06.24316848 medRxiv

Show abstract

Large language models (LLMs) are being explored for diagnostic decision support, yet their ability to estimate pre-test probabilities, vital for clinical decision-making, remains limited. This study evaluates two LLMs, Mistral-7B and Llama3-70B, using structured electronic health record data on three diagnosis tasks. We examined three current methods of extracting LLM probability estimations and revealed their limitations. We aim to highlight the need for improved techniques in LLM confidence estimation.

Matching journals

●Non-profit ◐University press ○Commercial

The top 5 journals account for 50% of the predicted probability mass.

Only show non-profit

Artificial Intelligence in Medicine

○ 15 papers in training set

Journal of Biomedical Informatics

○ 45 papers in training set

BMC Medical Informatics and Decision Making

○ 39 papers in training set

Journal of the American Medical Informatics Association

◐ 61 papers in training set

Computers in Biology and Medicine

○ 120 papers in training set

50% of probability mass above

International Journal of Medical Informatics

○ 25 papers in training set

JMIR Medical Informatics

◐ 17 papers in training set

◐ 37 papers in training set

Scientific Reports

○ 3102 papers in training set

npj Digital Medicine

○ 97 papers in training set

Journal of Medical Internet Research

◐ 85 papers in training set

● 4510 papers in training set

JCO Clinical Cancer Informatics

● 18 papers in training set

Journal of Personalized Medicine

○ 28 papers in training set

Frontiers in Artificial Intelligence

○ 18 papers in training set

Informatics in Medicine Unlocked

○ 21 papers in training set

PLOS Digital Health

● 91 papers in training set

BMC Bioinformatics

○ 383 papers in training set

BMC Medical Research Methodology

○ 43 papers in training set

Computer Methods and Programs in Biomedicine

○ 27 papers in training set

IEEE Journal of Biomedical and Health Informatics

● 34 papers in training set

Frontiers in Digital Health

○ 20 papers in training set

○ 67 papers in training set

◐ 51 papers in training set

Biology Methods and Protocols

◐ 53 papers in training set