Le deep learning

Qu’est ce que c’est ? 

Quelques noms ?

Le deep learning est une partie du machine learning qui est lui-même une partie de ce que l’on appelle l’intelligence artificielle. Ce sont des algorithmes qui fonctionnent en mimant le fonctionnement cérébral humain, c’est à dire qu’ils sont capables d’apprendre sans l’intervention humaine, et surtout à force de répétition, d’augmenter leur probabilité de réussite et de prédiction des phénomènes. Typiquement, à force d’être exposé à un signal, ils renforcent leur réponse à ce signal, et régressent sur d’autres, comme les neurones humains. Vous en avez d’ailleurs peut-être entendu parler sous le terme de « réseau de neurones ».

Ils sont particulièrement indiqués pour les grands jeux de données, y compris ceux qui montrent plus de variables que d’individus, pour comprendre les phénomènes entre toutes les variables, et celles qui sont à expliquer. 

 

Un algorithme que j’apprécie particulièrement, le forest Deep Neural Network (fDNN) est très utile pour classifier l’expression de gènes à partir de sous modèles de machine learning. (Kong et Yu, 2018)

D’autres comme ADAGE permettent de détecter plus précisément des voies métaboliques à partir de données d’expressions de gènes, qui sont alors reliés à l’expression probable de certaines protéines. (Tan et al, 2017)

 D’autres comme VASC sont utilisés pour détecter en RNA-seq signle cell, les patterns non linéaires dans le jeu de données. (Wang et Gu, 2018)

C’est un domaine en pleine expansion, et de nombreux autres algorithmes sont en construction ! Pour notre plus grand bonheur ! 

 

Références 

Kong, Y., Yu, T. A Deep Neural Network Model using Random Forest to Extract Feature Representation for Gene Expression Data Classification. Sci Rep 8, 16477 (2018). https://doi.org/10.1038/s41598-018-34833-6

Tan, J., Huyck, M., Hu, D., Zelaya, R. A., Hogan, D. A., and Greene, C. S. (2017b). ADAGE Signature Analysis: Differential Expression Analysis with Data-Defined Gene Sets. BMC Bioinforma. 18, 512. doi:10.1186/s12859-017-1905-4

Wang, D., and Gu, J. (2018). VASC: Dimension Reduction and Visualization of Single-Cell RNA-Seq Data by Deep Variational Autoencoder. Genomics, Proteomics Bioinforma. 16, 320–331. doi:10.1016/j.gpb.2018.08.003