Aller au contenu. | Aller à la navigation

Outils personnels

Navigation

Bioinformatique

Accueil d’étudiants en bio-informatique 

Nous encourageons les étudiants en bio-informatique à nous contacter pour un possible stage au sein de notre équipe. Nos sujets de recherche sont à l’interface entre l’organisation du génome et le métabolisme des ARN, en particulier l’épissage alternatif chez l’Homme. Si vous décidez de nous rejoindre vous pourrez acquérir des connaissances dans ces domaines biologiques.

Dans un environnement UNIX/LINUX et selon le sujet et la durée de votre stage, vous pourrez être amené à traiter des données de séquençage haut débit d’origine publique (i.e ENCODE ou GEO omnibus) ou générées par notre équipe. Elles peuvent être issues d’expériences variées comme du RNA-seq, du ChIP-seq, du Ribo-seq ou du 4C. Vous développerez ainsi des compétences sur les outils à utiliser pour leurs traitements (trimming, mapping, contrôle qualité...). Du fait de la grande taille de ces jeux de données (big data), vous pourrez vous familiarisez à l’utilisation de grilles de calcul.

Une fois traitées, ces données devront être analysées. Selon leur nature, vous utiliserez des outils bio-informatiques déjà existants ou en développerez des nouveaux en utilisant un langage de programmation de votre choix. Afin de faciliter leur exploration, ces données devront être stockées et organisées sous la forme, par exemple d’une base de données. De plus, une interface web pourra être développée à cette occasion.

Notre équipe est composée à la fois de biologistes et de bio-informaticiens. Ainsi, vous serez plongé au cœur d’une équipe où l’échange est important. Notre équipe est rattachée au LBMC (Laboratoire de Biologie et Modélisation de la Cellule) regroupant des thèmes de recherche transdisciplinaires (Mathématiques, Physique...). Chaque équipe communique sur leurs travaux tous les vendredis aux travers de séminaires. 

Le LBMC a mis en place un hub biocomputing dans le but de fixer des bonnes pratiques bio-informatiques et de former les membres du laboratoire. Si vous nous rejoignez, vous pourrez être formé à utiliser un gestionnaire de version, des outils de conteneurisation, de virtualisation et de gestion de pipeline. A l’issue de votre stage et de ces formations, vous posséderez un socle solide de compétences.

 


 

Outils développés par l’équipe :

- FaRLine :

Cet outil permet d’analyser l’épissage alternatif à partir de RNAseq. (http://kissplice.prabi.fr/pipeline_ks_farline/)

Complementarity of Assembly-First and Mapping-First Approaches for Alternative Splicing Annotation and Differential Analysis From RNAseq Data (Mar 2018, Sci Rep) Clara Benoit-Pilven, et al. doi: 10.1038/s41598-018-217707-7

- Exon Ontology :

Cette interface permet de prévoir les conséquences fonctionnelles des variations d'épissages alternatifs. Les utilisateurs peuvent analyser les exons pour identifier les caractéristiques des protéines qui sont associées à ces exons.

Identification of Protein Features Encoded by Alternative Exons Using Exon Ontology ( Jun 2017, Gen. Research) Léon-Charles Tranchevent, et al. doi : 10.1101/gr.212696.116

- FasterDB :

Il s’agit d’une interface web vers une base de données qui décrit les variants d'épissage connus des gènes codant pour les protéines humaines et murines et leur schéma d'épissage. Le site web fournit également des informations détaillées sur les transcrits et les UTR, y compris la force des sites d'épissage ainsi que les sites de liaison des miARN. Il est également possible de vérifier la conservation entre les gènes humains et ceux de souris au niveau des exons.

Endothelial, Epithelial, and Fibroblast Cells Exhibit Specific Splicing Programs Independently of Their Tissue of Origin ( Mar 2014, Gen. Research ) Pierre Mallinjoud, et al. doi : 10.1101/gr.162933.113

 

Publications Récentes :

Characterizing the interplay between gene nucleotide composition bias and splicing. Lemaire S, Fontrodona N, Aubé F, Claude JB, Polvèche H, Modolo L, Bourgeois CF, Mortreux F, Auboeuf D. Genome Biol. 2019 Nov 29;20(1):259. doi: 10.1186/s13059-019-1869-y. PMID: 31783898 Free PMC Article

Interplay between coding and exonic splicing regulatory sequences. Fontrodona N, Aubé F, Claude JB, Polvèche H, Lemaire S, Tranchevent LC, Modolo L, Mortreux F, Bourgeois CF, Auboeuf D. Genome Res. 2019 May;29(5):711-722. doi: 10.1101/gr.241315.118. Epub 2019 Apr 8. PMID: 30962178 

Complementarity of assembly-first and mapping-first approaches for alternative splicing annotation and differential analysis from RNAseq data. Benoit-Pilven C, Marchet C, Chautard E, Lima L, Lambert MP, Sacomoto G, Rey A, Cologne A, Terrone S, Dulaurier L, Claude JB, Bourgeois CF, Auboeuf D, Lacroix V. Sci Rep. 2018 Mar 9;8(1):4307. doi: 10.1038/s41598-018-21770-7. PMID: 29523794 Free PMC Article

Identification of protein features encoded by alternative exons using Exon Ontology. Tranchevent LC, Aubé F, Dulaurier L, Benoit-Pilven C, Rey A, Poret A, Chautard E, Mortada H, Desmet FO, Chakrama FZ, Moreno-Garcia MA, Goillot E, Janczarski S, Mortreux F, Bourgeois CF, Auboeuf D. Genome Res. 2017 Jun;27(6):1087-1097. doi: 10.1101/gr.212696.116. Epub 2017 Apr 18. PMID: 28420690 Free 

Endothelial, epithelial, and fibroblast cells exhibit specific splicing programs independently of their tissue of origin.  Mallinjoud P, Villemin JP, Mortada H, Polay Espinoza M, Desmet FO, Samaan S, Chautard E, Tranchevent LC, Auboeuf D.  Genome Res. 2014 Mar;24(3):511-21. doi: 10.1101/gr.162933.113. Epub 2013 Dec 4.

 


 

Nicolas Fontrodona

Ingénieur d'études en Bio-informatique. ENS de Lyon – LBMC – CNRS. 

Parcours et projets :

Après avoir effectué une licence en Modélisation et Informatique du Vivant (MIV) à Lyon, j’ai poursuivi mes études à Rennes ou j’ai obtenu le master de Biologie, Informatique et Génomique. Depuis novembre 2016, je suis ingénieur d’étude en bioinformatique dans l’équipe ReGArDS.

Mes missions principales sont centrées sur l’étude de la relation entre le biais de composition en nucléotide des exons et la régulation de leurs reconnaissances au cours de l’épissage alternatif. Plus précisément, avec mon équipe nous avons observé que les exons régulés par un même facteur d’épissage partageaient des biais de composition en nucléotide similaires. De plus, ces exons sont traduits en peptides qui eux-mêmes sont composés d’acides aminés aux propriétés physico-chimiques similaires. Ainsi, la régulation de l’inclusion d’exons par un facteur d’épissage va plus ou moins affecter la production de régions protéiques ayant des propriétés et donc potentiellement des fonctions similaires. Ces résultats ont été publiés dans Genome Research (Fontrodona et al. 2019). Ensuite, nous avons étendu l’analyse du biais de composition en nucléotide dans les exons régulés par un facteur d’épissage à leur région environnante tout en augmentant le nombre de facteurs d’épissages étudiés. Ceci a permis d’identifier deux groupes de facteurs : ceux augmentant l’inclusion d’exons riches en GC et ceux augmentant l’inclusion des exons riches en AT. Nous avons ensuite caractérisé deux mécanismes de régulation distincts s’exerçant pour l’épissage des exons régulés par ces deux groupes. Ces travaux ont été publiés dans Genome Biology (Lemaire et al. 2019). Actuellement, nous travaillons sur des jeux de données publiques issus de ChIA-PET pour construire une base données. Cette dernière nous permettra de tester si des exons partageant le même biais en nucléotide ou régulés par un même facteur d’épissage se trouvent à proximité spatiale dans le noyau.

 

 

Profil :

* Compétences :

- Langages de programmation : Python, Bash, R, SQL, HTML, CSS, Javascript

- OS : Linux, Windows, HPCC Grid Engine (SGE)

- Technologies de conteneurisation : Docker & Singularity

- Framework :

- workflow : Nextflow

- web : Django, VueJs, NuxtJS

 

* Missions :

– Analyse de données RNA-seq, ChIA-PET et Ribo-Seq

– Développement de pipeline d’analyses bio-informatiques

– Création et gestion de base de données

– Analyses statistiques

 

Publications :

- Interplay between coding and exonic splicing regulatory sequences. Fontrodona N, Aubé F, Claude JB, Polvèche H, Lemaire S, Tranchevent LC, Modolo L, Mortreux F, Bourgeois CF, Auboeuf D. Genome Res. 2019 May;29(5):711-722. doi: 10.1101/gr.241315.118. Epub 2019 Apr 8. PMID: 30962178

- Characterizing the interplay between gene nucleotide composition bias and splicing. Lemaire S, Fontrodona N, Aubé F, Claude JB, Polvèche H, Modolo L, Bourgeois CF, Mortreux F, Auboeuf D. Genome Biol. 2019 Nov 29;20(1):259. doi: 10.1186/s13059-019-1869-y. PMID: 31783898 Free PMC Article

 

Financements :

Institut National du Cancer (INCa)
Agence Nationale de la Recherche (ANR)

 


 

Audrey Lapendry

Doctorante en Bio-informatique. ENS de Lyon – LBMC. 

Parcours et projets :

Depuis octobre 2020, grâce à l’obtention d’un financement AFM-Téléthon, je suis doctorante en Bio-informatique dans l’équipe ReGArDS, sous la supervision de Didier Auboeuf. J’ai effectué mes études supérieures au sein de l’Université Clermont Auvergne, où j’ai obtenu une Licence en Biologie Cellulaire et Physiologie et un Master en Bio-informatique, parcours Analyse et Modélisation des Données. 

De nombreuses maladies neuromusculaires sont associées à des défauts à la fois de l’expression des gènes et du métabolisme cellulaire. Cependant la relation entre ces deux processus cellulaires est mal connue. L’objectif de ma thèse est de tester s’il existe un lien direct entre le métabolisme des acides aminés, plus spécifiquement leur biodisponibilité, et la régulation de l’expression des gènes, en particulier l’épissage alternatif qui joue un rôle majeur dans la différentiation des cellules musculaires. Les résultats obtenus pourraient ouvrir de nouvelles perspectives en termes de compréhension de l’évolution des maladies neuromusculaires, mais également en termes de thérapies, qui pourraient par exemple être associées à l’apport d’acides aminés particuliers.

Avant de débuter ma thèse, j’ai passé un an en tant qu’ingénieur d’études au sein de l’équipe ReGArDS. Mes travaux de recherche consistaient à analyser et à exploiter des données de ChIA-PET. Cette technologie permet d’étudier les interactions de la chromatine à l'échelle du génome. Nous avons utilisé ce type de données afin d’obtenir des listes d’exons et de gènes en interaction, que nous avons stockées dans une base de données, afin de faciliter leur exploration. Notre objectif ensuite était de comprendre pourquoi ces régions interagissent. Pour cela, nous avons considéré, grâce à des analyses statistiques, plusieurs hypothèses : des biais de composition communs, une régulation par le même facteur d’épissage et/ou des structures d’ADN non-B identiques. 

 

Profil :

* Compétences :

* Langages de programmation : Python, Bash, R, SQL, HTML, PHP et JavaScript

* OS / Ordonnanceurs : Linux, Windows & Mac / SGE et Slurm

* Workflow : Nextflow

* Gestionnaire de version de code : Git

 

* Expériences :

– Analyse de données : ChIP-seq, Hi-C, 3C et ChIA-PET

– Utilisation et production d’outils pour la détection de structures d’ADN non-B

– Développement de pipelines d’analyses bio-informatiques

– Mise en place de bases de données – Développement d’interfaces web – Analyses statistiques

 

Financement :

Association Française contre les Myopathies-Téléthon (AFM-Téléthon) 


 


 

Anciens bio-informaticiens de l’équipe au LBMC : 

- Jean-Baptiste Claude (IR)

- Sébastien Lemaire (Doctorant)

- Léon-Charles Tranchevent (Post-doctorant)

- Arnaud Poret (Post-doctorant)

- Clara Benoit-Pilven  (Doctorant)

- Émilie Chautard  (Post-doctorant)

 


 

Hélène Polvèche 

Ingénieur d'études en Bio-informatique. IStem – CECS 

Laboratoire d'accueil : ReGarDS - LBMC - ENS de Lyon. 

Créée en 2014 au sein de l’Institut des cellules Souches pour le Traitement et l’Étude des Maladies monogéniques (I-Stem) à Evry, la plateforme NGS & analyses génomiques (https://www.istem.eu/plateformes-technologiques/analysesgenomiques/) est une structure collaborative ouverte aux équipes académiques et a été récemment labellisée Genopole. La plateforme a permis depuis sa création de séquencer différents transcriptomes et d’aider des équipes dans l’analyse de ces projets (Darville et al, EBioMedicine 2016; Cambon et al, Molecular therapy. Methods & clinical development 2017; Galvan et al, Brain 2018; Hoch et al, Sci Rep. 2019). 

Depuis 2015, la plateforme est en collaboration avec l’équipe ReGarDS afin de pérenniser la veille bio-informatique en constante évolution et d’explorer de façon poussée des données issues de séquençage. Ce travail collaboratif a notamment permis l’étude avec l’équipe de C. Martinat, de l’impact de l’épissage alternatif dans la dystrophie myotonique de type 1 (DM1) et d’identifier de nouvelles cibles thérapeutiques (Laustriat et al, Mol Ther Nucleic Acids. 2016, Maury et al, iScience. 2019).

En parallèle de ces projets, la plateforme développe de nouveaux outils de séquençage ou d’analyses bio-informatiques. Par exemple, sont en développement une base de données d’expression génique permettant d’étudier l’expression d’un ou de plusieurs gènes dans différents modèles cellulaires dérivés de cellules souches pluripotentes humaines (https://www.istem.eu/wp-content/uploads/2019/07/Poster_JOBIM2019_2019-06-25_hpolveche.pdf) ou encore une base de données recensant l’effet de l’épissage alternatif de plus d’une 50aine de facteurs d’épissage.

 

Profil :

* Missions : 

- Traitements & Analyses de données (Transcriptomique) issues de NGS RNA-seq / Ampli-seq / Quant-seq (3'-seq) / miRNA-seq 

Données de séquençage : Illumina / Ion Proton 

- Mise en place de Pipelines d'analyses bio-informatiques

- Création d'outils via interfaces web 

* Langages de programmation : 

Bash, Perl, Python, R, HTML, SQL, PHP, Javascript, jQuery 

* Supports / OS : 

HPCC Grid Engine (SGE), Linux Debian - Ubuntu – Windows

 

Publications

- Characterizing the interplay between gene nucleotide composition bias and splicing. (Nov. 2019, Gen. Biology) Lemaire S, et al.  doi: 10.1186/s13059-019-1869-y 

- Physical and functional interaction between SET1/COMPASS complex component CFP-1 and a Sin3S HDAC complex in C. elegans. (Oct. 2019, NAR) Beurton F, et al.  doi: 10.1093/nar/gkz880 

- Interplay between coding and exonic splicing regulatory sequences. (May 2019, Gen. Research) Fontrodona N, Aubé F, et al.  doi: 10.1101/gr.241315.118 

- Human pluripotent stem cell-based drug screening reveals therapeutic potential of repurposable cardiac glycosides in myotonic dystrophy type 1 (Dec. 2018, iScience) Yves Maury, et al.  doi :10.1016/j.isci.2018.12.019