Probing the Surgical Competence of LLMs: A global health study leveraging AfriMedQA benchmarks

2025-10-07 surgery Title + abstract only

View on medRxiv

Show abstract

Global surgical care faces a severe workforce shortage, with more than 1.2 million additional specialists needed by 2030, particularly in low- and middle-income countries (LMICs). Large language models (LLMs) have demonstrated impressive medical reasoning on standardized exams, but their safety, reliability, and specialty-specific performance--especially in procedural fields such as surgery--remain uncertain. Here we evaluate over 40 state-of-the-art LLMs on 3,900 expert-authored multiple-choice...

Predicted journal destinations

npj Digital Medicine

85 training papers

1737 training papers

Scientific Reports

701 training papers

PLOS Digital Health

88 training papers

BMC Medical Informatics and Decision Making

36 training papers

553 training papers

Journal of Medical Internet Research

81 training papers

Computers in Biology and Medicine

39 training papers

Frontiers in Public Health

135 training papers

Nature Medicine

88 training papers

PLOS Computational Biology

141 training papers

262 training papers

PLOS Global Public Health

287 training papers

JAMA Network Open

125 training papers

Nature Communications

483 training papers

Journal of the American Medical Informatics Association

53 training papers

Human Brain Mapping

53 training papers

Scientific Data

30 training papers

Journal of Clinical Medicine

77 training papers

57 training papers

Journal of Biomedical Informatics

37 training papers

24 training papers

Frontiers in Medicine

99 training papers

155 training papers

Biology Methods and Protocols

19 training papers

82 training papers