A Machine Learning Approach to Parkinson's Disease Blood Transcriptomics

Ester Pantaleo; Alfonso Monaco; Nicola Amoroso; Angela Lombardi; Loredana Bellantuono; Daniele Urso; Claudio Lo Giudice; Ernesto Picardi; Benedetta Tafuri; Salvatore Nigro; Graziano Pesole; Sabina Tangaro; Giancarlo Logroscino; Roberto Bellotti

doi:10.3390/genes13050727

A Machine Learning Approach to Parkinson's Disease Blood Transcriptomics

Genes (Basel). 2022 Apr 21;13(5):727. doi: 10.3390/genes13050727.

Authors

Ester Pantaleo^{1

2

3}, Alfonso Monaco¹, Nicola Amoroso^{1

4}, Angela Lombardi^{1

3}, Loredana Bellantuono^{1

2}, Daniele Urso^{5

6}, Claudio Lo Giudice⁷, Ernesto Picardi^{7

8}, Benedetta Tafuri⁵, Salvatore Nigro^{5

9}, Graziano Pesole^{7

8}, Sabina Tangaro^{1

10}, Giancarlo Logroscino^{2

5}, Roberto Bellotti^{1

3}

Affiliations

¹ Istituto Nazionale di Fisica Nucleare (INFN), Sezione di Bari, Via A. Orabona 4, 70125 Bari, Italy.
² Dipartimento di Scienze Mediche di Base, Neuroscienze e Organi di Senso, Università degli Studi di Bari Aldo Moro, Piazza G. Cesare 11, 70124 Bari, Italy.
³ Dipartimento Interateneo di Fisica M. Merlin, Università degli Studi di Bari Aldo Moro, Via G. Amendola 173, 70125 Bari, Italy.
⁴ Dipartimento di Farmacia-Scienze del Farmaco, Università degli Studi di Bari Aldo Moro, Via A. Orabona 4, 70125 Bari, Italy.
⁵ Centro per le Malattie Neurodegenerative e l'Invecchiamento Cerebrale, Dipartimento di Ricerca Clinica in Neurologia, Università degli Studi di Bari Aldo Moro, Pia Fondazione Cardinale G. Panico, 73039 Tricase, Italy.
⁶ Institute of Psychiatry, Psychology and Neuroscience, King's College London, De Crespigny Park, London SE5 8AF, UK.
⁷ Dipartimento di Bioscienze, Biotecnologie e Biofarmaceutica, Università degli Studi di Bari Aldo Moro, Via A. Orabona 4, 70125 Bari, Italy.
⁸ Istituto di Biomembrane, Bioenergetica e Biotecnologie Molecolari, Consiglio Nazionale delle Ricerche, Via G. Amendola 122/O, 70126 Bari, Italy.
⁹ Istituto di Nanotecnologia (NANOTEC), Consiglio Nazionale delle Ricerche, Via Monteroni, 73100 Lecce, Italy.
¹⁰ Dipartimento di Scienze del Suolo, della Pianta e degli Alimenti, Università degli Studi di Bari Aldo Moro, Via A. Orabona 4, 70125 Bari, Italy.

Abstract

The increased incidence and the significant health burden associated with Parkinson's disease (PD) have stimulated substantial research efforts towards the identification of effective treatments and diagnostic procedures. Despite technological advancements, a cure is still not available and PD is often diagnosed a long time after onset when irreversible damage has already occurred. Blood transcriptomics represents a potentially disruptive technology for the early diagnosis of PD. We used transcriptome data from the PPMI study, a large cohort study with early PD subjects and age matched controls (HC), to perform the classification of PD vs. HC in around 550 samples. Using a nested feature selection procedure based on Random Forests and XGBoost we reached an AUC of 72% and found 493 candidate genes. We further discussed the importance of the selected genes through a functional analysis based on GOs and KEGG pathways.

Keywords: Parkinson’s disease; blood transcriptomics; feature selection; inflammation; machine learning; mitochondrial dysfunction; oxidative stress; xgboost.

MeSH terms

Cohort Studies
Early Diagnosis
Humans
Machine Learning
Parkinson Disease* / diagnosis
Parkinson Disease* / genetics
Transcriptome / genetics