Towards Superhuman Imitation Learning for Sequential Head-and-Neck Cancer Treatment Decisions

2025-12-15 health informatics Title + abstract only

View on medRxiv

Show abstract

We propose a simulator-driven imitation learning framework for sequential decision making in head and neck cancer (HNC) treatment. Our method, Superhuman Policy Gradient Optimization (SPGO), integrates inverse reinforcement learning principles with policy gradient updates to derive three-stage treatment policies directly from recorded physician decisions. It leverages a pre-trained clinical simulator--combining a variational autoencoder and gradient boosting models--to generate complete, tempora...

Predicted journal destinations

Scientific Reports

701 training papers

npj Digital Medicine

85 training papers

Journal of the American Medical Informatics Association

53 training papers

Nature Communications

483 training papers

Journal of Biomedical Informatics

37 training papers

35 training papers

PLOS Digital Health

88 training papers

BMC Medical Informatics and Decision Making

36 training papers

1737 training papers

Computers in Biology and Medicine

39 training papers

Journal of Medical Internet Research

81 training papers

PLOS Computational Biology

141 training papers

Communications Medicine

63 training papers

International Journal of Medical Informatics

25 training papers

JMIR Medical Informatics

16 training papers

Nature Medicine

88 training papers

BMC Medical Research Methodology

41 training papers

15 training papers

Scientific Data

30 training papers

Brain Communications

79 training papers

JAMA Network Open

125 training papers

Bulletin of Mathematical Biology

17 training papers

Frontiers in Digital Health

18 training papers

262 training papers