PROJET COFINANCÉ PAR IVADO
Dans ce projet, nous avons implémenté plusieurs méthodes en apprentissage machine et profond pour analyser des données omiques à différents niveaux : génomique, épigénomique, transcriptomique, protéomique, métabolomique. Plusieurs représentations des données génétiques ont été explorées, basées sur l’encodage des séquences complètes (RecDL), des variants génétiques (Diet Network), et sur l’ontologie génétique (DeepSimDef). Nous avons réalisé des études en métabolomique des maladies cardiaques à l’aide d’approches d’apprentissage automatique : nous avons étudié l’impact de l’infarctus du myocarde sur le métabolome des patients, qui a révélé une signature différentielle des acides gras selon le médicament par le biais de méthodes d’apprentissage non supervisées. Nous avons également identifié l’acide lignocérique, potentiellement important dans l’insuffisance cardiaque, par le biais de la méthode XGboost, un métabolite actuellement sous validation biologique. Finalement, nous avons évalué la généralisabilité de nos approches, notamment du Diet Network pour prédire l’ethnicité sur la base de données génomiques. Nous avons démontré la capacité de l’approche à faire des prédictions précises sur des ensembles de données indépendants, avec différents ensembles de marqueurs génétiques et différents niveaux de données manquantes, qui sont omniprésentes dans les données omiques. Nos travaux ont également révélé l’importance de l’interprétation biologique dans les prédictions, un aspect sur lequel nous concentrerons nos travaux futurs.
Centre de génomique responsable : Génome Québec
Partenaire : IVADO
Cochercheurs :
Simon | Gravel | Université McGill |
Yoshua | Bengio | Université de Montréal |