Fine-Tuning PubMedBERT for Hierarchical Condition Category Classification

Wang, X.; Hammarlund, N.; Prosperi, M.; Zhu, Y.; Revere, L.

2026-04-15 health systems and quality improvement

10.64898/2026.04.13.26350814 medRxiv

Show abstract

Automating Hierarchical Condition Category (HCC) assignment directly from unstructured electronic health record (EHR) notes remains an important but understudied problem in clinical informatics. We present HCC-Coder, an end-to-end NLP system that maps narrative documentation to 115 Centers for Medicare & Medicaid Services(CMS) HCC codes in a multi-label setting. On the test dataset, HCC-Coder achieves a macro-F1 of 0.779 and a micro-F1 of 0.756, with a macro-sensitivity of 0.819 and macro-specificity of 0.998. By contrast, Generative Pre-trained Transformer (GPT)-4o achieves the highest score of a macro-F1 of 0.735 and a micro-F1 of 0.708 under five-shot prompting. The fine-tuned model demonstrates consistent absolute improvements of 4%-5% in F1-scores over GPT-4o. To address severe label imbalance, we incorporate inverse-frequency weighting and per-label threshold calibration. These findings suggest that domain-adapted transformers provide more balanced and reliable performance than prompt-based large language models for hierarchical clinical coding and risk adjustment.

Matching journals

●Non-profit ◐University press ○Commercial

The top 8 journals account for 50% of the predicted probability mass.

Only show non-profit

Journal of Biomedical Informatics

○ 45 papers in training set

○ 575 papers in training set

Scientific Reports

○ 3102 papers in training set

● 4510 papers in training set

npj Digital Medicine

○ 97 papers in training set

Proceedings of the National Academy of Sciences

● 2130 papers in training set

BMC Medical Informatics and Decision Making

○ 39 papers in training set

Advanced Science

○ 249 papers in training set

50% of probability mass above

Journal of Personalized Medicine

○ 28 papers in training set

European Heart Journal - Digital Health

◐ 15 papers in training set

Nature Computational Science

○ 50 papers in training set

◐ 1061 papers in training set

Journal of the American Medical Informatics Association

◐ 61 papers in training set

Nature Communications

○ 4913 papers in training set

Genome Medicine

○ 154 papers in training set

Nucleic Acids Research

◐ 1128 papers in training set

Communications Medicine

○ 85 papers in training set

◐ 22 papers in training set

○ 15 papers in training set

○ 1063 papers in training set

NAR Genomics and Bioinformatics

◐ 214 papers in training set

Nature Machine Intelligence

○ 61 papers in training set

BMC Bioinformatics

○ 383 papers in training set

Medical Decision Making

○ 10 papers in training set

● 429 papers in training set

○ 70 papers in training set

Nature Human Behaviour

○ 85 papers in training set

Artificial Intelligence in Medicine

○ 15 papers in training set

The Lancet Digital Health

○ 25 papers in training set

○ 555 papers in training set