Séminaire DATAIA 21/09 | Laurent JACOB « Learning from biological sequences in functional and evolutionary genomics »

21 septembre 2023 | 12h30 - 14h00

Jeudi 21 septembre 2023, 12h30

Dans le cadre de son animation scientifique, l'Institut DATAIA organise tout au long de l'année des séminaires visant à échanger autour de l'IA.

Séminaire DATAIA 21/09 | Laurent JACOB « Learning from biological sequences in functional and evolutionary genomics »
  • septembre 2023
    • jeudi 21 12h30 - 14h00

(Laboratory of Computational and Quantitative Biology - Sorbonne Université, LCQB, UMR 7238) présentera ses travaux sur le thème "Learning from biological sequences in functional and evolutionary genomics". Laurent Jacob s'intéresse au développement de méthodes statistiques et d'apprentissage automatique pour résoudre des problèmes en biologie moléculaire.

Résumé :

  • GWAS microbienne : outils pour identifier les déterminants génétiques des traits phénotypiques tels que les résistances antimicrobiennes. L'importance des gènes accessoires dans les microbes rend l'approche habituelle des SNP inappropriée. Je développe des solutions qui s'appuient sur les k-mers, c'est-à-dire sur la présence de courtes séquences dans les génomes. présence de courtes séquences dans les génomes.

  • Prédiction à partir de séquences biologiques : réseaux de neurones qui prennent une séquence biologique en entrée et prédisent une propriété de cette séquence. séquence biologique en entrée et prédisent une propriété de cette séquence. cette séquence. Cela s'applique par exemple à la génomique régulatrice ou à la prédiction des plis. ou à la prédiction des plis. Je travaille sur la régularisation et l'inférence statistique d'inférence statistique sur les caractéristiques extraites par ces réseaux.

  • Apprentissage automatique pour la génomique évolutive : réseaux de neurones pour déduire les paramètres des modèles d'évolution des séquences. paramètres des modèles d'évolution des séquences. Pour certains modèles complexes, la maximisation de la vraisemblance est trop difficile mais l'échantillonnage est facile. J'utilise une J'utilise une grande quantité de données simulées pour apprendre une fonction qui inverse le modèle, et passe par exemple d'une famille de gènes à une phylogénie.

Type d'événement Conférence / séminaire / webinaire - conference / seminar / webinar

Thématique Recherche - Research

Public Tout public

CentraleSupélec, Amphithéâtre e.068 (bâtiment Bouygues), Gif-sur-Yvette

8 rue Joliot Curie Gif-sur-Yvette