Cross-Attention Enables Context-Aware Multimodal Skin Lesion Diagnosis

Mridha, K.; Islam, H.

2026-03-11 health informatics

10.64898/2026.03.10.26348046 medRxiv

Show abstract

Clinical diagnosis of skin lesions integrates visual dermoscopic features with patient context such as age, skin type, and lesion characteristics. However, most artificial intelligence systems for dermoscopic analysis rely solely on image data and ignore structured clinical metadata. We developed a multimodal deep learning framework that combines dermoscopic images with patient metadata and evaluated whether cross-attention mechanisms better capture contextual interactions than conventional fusion strategies. Using 1,568 lesions from the PAD-UFES-20 dataset (69% malignant) with associated metadata (age, sex, Fitzpatrick skin type, anatomical site, and lesion diameter), we compared four models: metadata-only logistic regression, image-only ResNet18, late fusion via feature concatenation, and cross-attention-based fusion. The image-only model achieved strong discrimination (AUC 0.9776), while late fusion slightly reduced performance (AUC 0.9717). The proposed cross-attention model achieved the best overall results (AUC 0.9818, AUPRC 0.9924) with improved calibration (ECE 0.0379). These findings suggest that attention-based multimodal learning enables more effective integration of patient context for automated skin lesion diagnosis.

Matching journals

●Non-profit ◐University press ○Commercial

The top 7 journals account for 50% of the predicted probability mass.

Only show non-profit

Scientific Reports

○ 3102 papers in training set

npj Digital Medicine

○ 97 papers in training set

Nature Communications

○ 4913 papers in training set

Frontiers in Digital Health

○ 20 papers in training set

IEEE Journal of Biomedical and Health Informatics

● 34 papers in training set

Scientific Data

○ 174 papers in training set

Nature Machine Intelligence

○ 61 papers in training set

50% of probability mass above

● 4510 papers in training set

Computers in Biology and Medicine

○ 120 papers in training set

Informatics in Medicine Unlocked

○ 21 papers in training set

○ 48 papers in training set

○ 130 papers in training set

○ 70 papers in training set

PLOS Digital Health

● 91 papers in training set

JCO Clinical Cancer Informatics

● 18 papers in training set

BMC Medical Informatics and Decision Making

○ 39 papers in training set

Communications Medicine

○ 85 papers in training set

International Journal of Medical Informatics

○ 25 papers in training set

Journal of Medical Internet Research

◐ 85 papers in training set

JMIR Medical Informatics

◐ 17 papers in training set

PLOS Computational Biology

● 1633 papers in training set

Advanced Science

○ 249 papers in training set

NeuroImage: Clinical

○ 132 papers in training set

Journal of Pathology Informatics

○ 13 papers in training set

◐ 172 papers in training set

npj Precision Oncology

○ 48 papers in training set

Journal of Medical Imaging

● 11 papers in training set

Science Advances

● 1098 papers in training set

○ 1063 papers in training set

◐ 147 papers in training set