Faites parler vos données
Les biostatistiques vous permettront d’analyser vos données en profondeur, de valoriser d’anciens jeux de données permettant de répondre à de nouvelles questions. Elles concernent tout ce qui est lié au vivant, sur des échelles macroscopiques comme microscopiques.
Les bioinformatiques vous permettront d’étudier des phénomènes biologiques/biochimiques, allant du gène à l’expression de ce gène, jusqu’à l’expression de métabolites et protéines, permettant de comprendre le fonctionnement de certaines voies métaboliques, ou d’effets de traitements ou facteurs sur le fonctionnement cellulaire.
Réalisations
Nettoyage des données
Avoir des données propres est le point de départ de toute analyse bioinformatique ou biostatistique.
Modélisation
Pour répondre à certains besoins, il est nécessaire de modéliser. La modélisation peut-être explicative, permettant alors de comprendre les liens de plusieurs facteurs avec une variable d’intérêt, ou prédictive, dans le cas ou il y a besoin de comprendre l’évolution d’un ou plusieurs paramètres.
Statistiques inférentielles
Dans le cas ou plusieurs groupes sont comparés selon une variable d’intérêt, il est intéressant d’utiliser la statistique inférentielle (fréquentiste ou bayésienne), paramétrique ou non paramétrique, pour répondre à ces questions.
Machine learning
Pour les jeux de données plus complexes très souvent multifactoriels, le machine learning permet d’entraîner l’algorithme à reconnaître des patterns suivants certaines conditions. Cela permet de détecter beaucoup plus vite certains phénomènes, ou liens entre variables, et également de prédire des variables suivant des conditions que nous n’avons pas dans le jeux de données.
Traitement de données métabarcoding
Le métabarcoding consiste à amplifier des gènes ribosomiques de différents Règnes, afin de suivre des taxons d’intérêts. Cette technique permet entre autre, de faire l’inventaire des espèces retrouvées dans une matrice, ou un environnement, de modéliser des réseaux d’interactions, d’identifier les espèces keystones, d’établir des comparaisons de richesse, de diversité, et encore moulte possibilités !
Traitement de données métagénomiques
Ces données complexes de métagénome (DNA-seq) permettent de reconstruire le génome complet de l’environnement/échantillon étudié. Il permet d’identifier les espèces et au mieux, souches présentes, et leur potentiel fonctionnel à partir des protéines que les gènes peuvent coder. L’identification des fonction potentielles n’est possible que si le génome est suffisamment complet et que la souche est identifiée.
Comparaison de souches
Alignement des séquences et quantification des différences de nucléotides, identification des mutations entre les souches comparées
Etude de la virulence et de la pathogénicité des souches
Etude du pathogénome, des gènes de virulence (multiplication), et des gènes d’antibioresistances.
Traitement de données métatranscriptomique
Les données RNA-seq, permettent de reconstruire le métatranscriptome de l’échantillon, c’est à dire, de savoir comment les organismes présents se sont exprimés. Cela répond à la question qui et comment. Actuellement l’assemblage non guidé (sans métagénomique au préalable) a encore des lacunes, c’est pourquoi je conseillerai de passer avant par la réalisation d’une carte de métagénome.
Une fois les gènes reliés à des enzymes, et à des voies métaboliques, on peut comprendre comment les organismes se sont exprimés dans le milieu.
Aide à la réalisation des protocoles
Réaliser un protocole pour mener une étude est parfois compliqué, surtout si votre sujet d’étude fait partie d’un environnement très complexe ou que le phénomène a étudié est dépendant de nombreux facteurs. En cas de doute, je serais là pour vous aider !
Deep learning
Une sous-famille du machine learning, encore plus puissante et souvent utilisée dans le traitement de données génétique. Les algorithmes de deep learning se différencient surtout par le fait qu’ils sont capable d’apprendre et d’améliorer leur performance à force de répétitions. Ils sont aussi très informatifs quand le jeu de données montre plus de variables que d’individus ce qui est moins le cas avec le machine learning.
A propos de moi
Qui je suis
Publications
Parcours scientifique
Site Info
Mentions légales
Conditions générales de prestation de services
Contact
Contactez moi