Back

Bridging Big Data: Procedures for Combining Non-equivalent Cognitive Measures from the ENIGMA Consortium

Kennedy, E.; Vadlamani, S.; Lindsey, H. M.; Lei, P.-W.; Pugh, M. J.; Adamson, M.; Alda, M.; Alonso-Lana, S.; Ambrogi, S.; Anderson, T. J.; Arango, C.; Asarnow, R.; Avram, M.; Ayesa-Arriola, R.; Babikian, T.; Banaj, N.; Bird, L. J.; Borgwardt, S.; Brodtmann, A.; Brosch, K.; Caeyenberghs, K.; Calhoun, V. D.; Chiaravalloti, N. D.; Cifu, D. X.; Crespo-Facorro, B.; Dalrymple-Alford, J. C.; Dams-O'Connor, K.; Dannlowski, U.; Darby, D.; Davenport, N.; DeLuca, J.; Diaz-Caneja, C. M.; Disner, S. G.; Dobryakova, E.; Ehrlich, S.; Esopenko, C.; Ferrarelli, F.; Frank, L. E.; Franz, C.; Fuentes-Claramonte,

2023-01-19 neuroscience

10.1101/2023.01.16.524331 bioRxiv

Show abstract

Investigators in neuroscience have turned to Big Data to address replication and reliability issues by increasing sample sizes, statistical power, and representativeness of data. These efforts unveil new questions about integrating data arising from distinct sources and instruments. We focus on the most frequently assessed cognitive domain - memory testing - and demonstrate a process for reliable data harmonization across three common measures. We aggregated global raw data from 53 studies totaling N = 10,505 individuals. A mega-analysis was conducted using empirical bayes harmonization to remove site effects, followed by linear models adjusting for common covariates. A continuous item response theory (IRT) model estimated each individuals latent verbal learning ability while accounting for item difficulties. Harmonization significantly reduced inter-site variance while preserving covariate effects, and our conversion tool is freely available online. This demonstrates that large-scale data sharing and harmonization initiatives can address reproducibility and integration challenges across the behavioral sciences. TeaserWe present a global effort to devise harmonization procedures necessary to meaningfully leverage big data.

Bridging Big Data: Procedures for Combining Non-equivalent Cognitive Measures from the ENIGMA Consortium

Matching journals