MedPI: Evaluating AI Systems in Medical Patient-facing Interactions

2026-01-01 health informatics Title + abstract only

View on medRxiv

Show abstract

AO_SCPLOWBSTRACTC_SCPLOWWe present MO_SCPLOWEDC_SCPLOWPI, a high-dimensional benchmark for evaluating large language models (LLMs) in patient-clinician conversations. Unlike single-turn question-answer (QA) benchmarks, MO_SCPLOWEDC_SCPLOWPI evaluates the medical dialogue across 105 dimensions comprising the medical process, treatment safety, treatment outcomes and doctor-patient communication across a granular, accreditation-aligned rubric. MO_SCPLOWEDC_SCPLOWPI comprises five layers: (1) PO_SCP...

Predicted journal destinations

npj Digital Medicine

85 training papers

Journal of the American Medical Informatics Association

53 training papers

PLOS Digital Health

88 training papers

Journal of Biomedical Informatics

37 training papers

35 training papers

Journal of Medical Internet Research

81 training papers

Scientific Reports

701 training papers

BMC Medical Informatics and Decision Making

36 training papers

1737 training papers

International Journal of Medical Informatics

25 training papers

Computers in Biology and Medicine

39 training papers

JMIR Medical Informatics

16 training papers

BMC Medical Research Methodology

41 training papers

Frontiers in Digital Health

18 training papers

15 training papers

JMIR Formative Research

31 training papers

553 training papers

Nature Communications

483 training papers

Nature Medicine

88 training papers