Aller au contenu. | Aller à la navigation

Outils personnels

Navigation

Bioinformatique

Accueil d’étudiants en bio-informatique 

Nous encourageons les étudiants en bio-informatique à nous contacter pour un possible stage au sein de notre équipe. Nos sujets de recherche sont à l’interface entre l’organisation du génome et le métabolisme des ARN, en particulier l’épissage alternatif chez l’Homme. Si vous décidez de nous rejoindre vous pourrez acquérir des connaissances dans ces domaines biologiques.

Dans un environnement UNIX/LINUX et selon le sujet et la durée de votre stage, vous pourrez être amené à traiter des données de séquençage haut débit d’origine publique (i.e ENCODE ou GEO omnibus) ou générées par notre équipe. Elles peuvent être issues d’expériences variées comme du RNA-seq, du ChIP-seq, du Ribo-seq ou du 4C. Vous développerez ainsi des compétences sur les outils à utiliser pour leurs traitements (trimming, mapping, contrôle qualité...). Du fait de la grande taille de ces jeux de données (big data), vous pourrez vous familiarisez à l’utilisation de grilles de calcul.

Une fois traitées, ces données devront être analysées. Selon leur nature, vous utiliserez des outils bio-informatiques déjà existants ou en développerez des nouveaux en utilisant un langage de programmation de votre choix. Afin de faciliter leur exploration, ces données devront être stockées et organisées sous la forme, par exemple d’une base de données. De plus, une interface web pourra être développée à cette occasion.

Notre équipe est composée à la fois de biologistes et de bio-informaticiens. Ainsi, vous serez plongé au cœur d’une équipe où l’échange est important. Notre équipe est rattachée au LBMC (Laboratoire de Biologie et Modélisation de la Cellule) regroupant des thèmes de recherche transdisciplinaires (Mathématiques, Physique...). Chaque équipe communique sur leurs travaux tous les vendredis aux travers de séminaires. 

Le LBMC a mis en place un hub biocomputing dans le but de fixer des bonnes pratiques bio-informatiques et de former les membres du laboratoire. Si vous nous rejoignez, vous pourrez être formé à utiliser un gestionnaire de version, des outils de conteneurisation, de virtualisation et de gestion de pipeline. A l’issue de votre stage et de ces formations, vous posséderez un socle solide de compétences.

 


 

Outils développés par l’équipe :

- FaRLine :

Cet outil permet d’analyser l’épissage alternatif à partir de RNAseq. (http://kissplice.prabi.fr/pipeline_ks_farline/)

Complementarity of Assembly-First and Mapping-First Approaches for Alternative Splicing Annotation and Differential Analysis From RNAseq Data (Mar 2018, Sci Rep) Clara Benoit-Pilven, et al. doi: 10.1038/s41598-018-217707-7

- Exon Ontology :

Cette interface permet de prévoir les conséquences fonctionnelles des variations d'épissages alternatifs. Les utilisateurs peuvent analyser les exons pour identifier les caractéristiques des protéines qui sont associées à ces exons.

Identification of Protein Features Encoded by Alternative Exons Using Exon Ontology ( Jun 2017, Gen. Research) Léon-Charles Tranchevent, et al. doi : 10.1101/gr.212696.116

- FasterDB :

Il s’agit d’une interface web vers une base de données qui décrit les variants d'épissage connus des gènes codant pour les protéines humaines et murines et leur schéma d'épissage. Le site web fournit également des informations détaillées sur les transcrits et les UTR, y compris la force des sites d'épissage ainsi que les sites de liaison des miARN. Il est également possible de vérifier la conservation entre les gènes humains et ceux de souris au niveau des exons.

Endothelial, Epithelial, and Fibroblast Cells Exhibit Specific Splicing Programs Independently of Their Tissue of Origin ( Mar 2014, Gen. Research ) Pierre Mallinjoud, et al. doi : 10.1101/gr.162933.113

 

Publications Récentes :

Modulation of alternative splicing during early infection of human primary B lymphocytes with Epstein-Barr virus (EBV): a novel function for the viral EBNA-LP protein.  Manet E, Polvèche H, Mure F, Mrozek-Gorska P, Roisné-Hamelin F, Hammerschmidt W, Auboeuf D, Gruffat H. NAR. Sept 2021. doi : 10.1093/nar/gkab787

SISTEMA: A large and standardized collection of transcriptome data sets for human pluripotent stem cell research.  Jarrige M*, Polvèche H*, Carteron A, Janczarski S, Peschanski M, Auboeuf D, Martinat C. iScience. Jun 2021. doi : 10.1016/j.isci.2021.102767.  http://sistema.ens-lyon.fr

Integrative Cell Type-Specific Multi-Omics Approaches Reveal Impaired Programs of Glial Cell Differentiation in Mouse Culture Models of DM1. González-Barriga A, Lallemant L, Dincã DM, Braz SO, Polvèche H, Magneron P, Pionneau C, Huguet-Lachon A, Claude JB, Chhuon C, Chiara Guerrera I, Bourgeois CF, Auboeuf D, Gourdon G and Gomes-Pereira M. Front. Cell. Neurosci. May 2021. doi: 10.3389/fncel.2021.662035

Intragenic Recruitment of NF-κB Drives Splicing Modifications Upon Activation by the Oncogene Tax of HTLV-1. Ben Ameur L, Marie P, Thenoz M, Giraud G, Combe E, Claude JB, Lemaire S, Fontrodona N, Polveche H, Bastien M, Gessain A, Wattel E, Bourgeois CF, Auboeuf D,  Mortreux F. Nature Comm. jun 2021. doi: 10.1038/s41467-020-16853-x

Characterizing the interplay between gene nucleotide composition bias and splicing. Lemaire S, Fontrodona N, Aubé F, Claude JB, Polvèche H, Modolo L, Bourgeois CF, Mortreux F, Auboeuf D. Genome Biol. 2019 Nov 29;20(1):259. doi: 10.1186/s13059-019-1869-y. PMID: 31783898 Free PMC Article

Interplay between coding and exonic splicing regulatory sequences. Fontrodona N, Aubé F, Claude JB, Polvèche H, Lemaire S, Tranchevent LC, Modolo L, Mortreux F, Bourgeois CF, Auboeuf D. Genome Res. 2019 May;29(5):711-722. doi: 10.1101/gr.241315.118. Epub 2019 Apr 8. PMID: 30962178 

Complementarity of assembly-first and mapping-first approaches for alternative splicing annotation and differential analysis from RNAseq data. Benoit-Pilven C, Marchet C, Chautard E, Lima L, Lambert MP, Sacomoto G, Rey A, Cologne A, Terrone S, Dulaurier L, Claude JB, Bourgeois CF, Auboeuf D, Lacroix V. Sci Rep. 2018 Mar 9;8(1):4307. doi: 10.1038/s41598-018-21770-7. PMID: 29523794 Free PMC Article

Identification of protein features encoded by alternative exons using Exon Ontology. Tranchevent LC, Aubé F, Dulaurier L, Benoit-Pilven C, Rey A, Poret A, Chautard E, Mortada H, Desmet FO, Chakrama FZ, Moreno-Garcia MA, Goillot E, Janczarski S, Mortreux F, Bourgeois CF, Auboeuf D. Genome Res. 2017 Jun;27(6):1087-1097. doi: 10.1101/gr.212696.116. Epub 2017 Apr 18. PMID: 28420690 Free 

Endothelial, epithelial, and fibroblast cells exhibit specific splicing programs independently of their tissue of origin.  Mallinjoud P, Villemin JP, Mortada H, Polay Espinoza M, Desmet FO, Samaan S, Chautard E, Tranchevent LC, Auboeuf D.  Genome Res. 2014 Mar;24(3):511-21. doi: 10.1101/gr.162933.113. Epub 2013 Dec 4.

 


 

Anciens bio-informaticiens de l’équipe au LBMC : 

- Jean-Baptiste Claude (IR)

- Sébastien Lemaire (Doctorant)

- Léon-Charles Tranchevent (Post-doctorant)

- Arnaud Poret (Post-doctorant)

- Clara Benoit-Pilven  (Doctorant)

- Émilie Chautard  (Post-doctorant)

 


 

Nicolas Fontrodona

Ingénieur d'études en Bio-informatique. ENS de Lyon – LBMC – CNRS. 

Parcours et projets :

Après avoir effectué une licence en Modélisation et Informatique du Vivant (MIV) à Lyon, j’ai poursuivi mes études à Rennes ou j’ai obtenu le master de Biologie, Informatique et Génomique. Depuis novembre 2016, je suis ingénieur d’étude en bioinformatique dans l’équipe ReGArDS.

Mes missions principales sont centrées sur l’étude de la relation entre le biais de composition en nucléotide des exons et la régulation de leurs reconnaissances au cours de l’épissage alternatif. Plus précisément, avec mon équipe nous avons observé que les exons régulés par un même facteur d’épissage partageaient des biais de composition en nucléotide similaires. De plus, ces exons sont traduits en peptides qui eux-mêmes sont composés d’acides aminés aux propriétés physico-chimiques similaires. Ainsi, la régulation de l’inclusion d’exons par un facteur d’épissage va plus ou moins affecter la production de régions protéiques ayant des propriétés et donc potentiellement des fonctions similaires. Ces résultats ont été publiés dans Genome Research (Fontrodona et al. 2019). Ensuite, nous avons étendu l’analyse du biais de composition en nucléotide dans les exons régulés par un facteur d’épissage à leur région environnante tout en augmentant le nombre de facteurs d’épissages étudiés. Ceci a permis d’identifier deux groupes de facteurs : ceux augmentant l’inclusion d’exons riches en GC et ceux augmentant l’inclusion des exons riches en AT. Nous avons ensuite caractérisé deux mécanismes de régulation distincts s’exerçant pour l’épissage des exons régulés par ces deux groupes. Ces travaux ont été publiés dans Genome Biology (Lemaire et al. 2019). Actuellement, nous travaillons sur des jeux de données publiques issus de ChIA-PET pour construire une base données. Cette dernière nous permettra de tester si des exons partageant le même biais en nucléotide ou régulés par un même facteur d’épissage se trouvent à proximité spatiale dans le noyau.

 

 

Profil :

* Compétences :

- Langages de programmation : Python, Bash, R, SQL, HTML, CSS, Javascript

- OS : Linux, Windows, HPCC Grid Engine (SGE)

- Technologies de conteneurisation : Docker & Singularity

- Framework :

- workflow : Nextflow

- web : Django, VueJs, NuxtJS

 

* Missions :

– Analyse de données RNA-seq, ChIA-PET et Ribo-Seq

– Développement de pipeline d’analyses bio-informatiques

– Création et gestion de base de données

– Analyses statistiques

 

Publications :

- Interplay between coding and exonic splicing regulatory sequences. Fontrodona N, Aubé F, Claude JB, Polvèche H, Lemaire S, Tranchevent LC, Modolo L, Mortreux F, Bourgeois CF, Auboeuf D. Genome Res. 2019 May;29(5):711-722. doi: 10.1101/gr.241315.118. Epub 2019 Apr 8. PMID: 30962178

- Characterizing the interplay between gene nucleotide composition bias and splicing. Lemaire S, Fontrodona N, Aubé F, Claude JB, Polvèche H, Modolo L, Bourgeois CF, Mortreux F, Auboeuf D. Genome Biol. 2019 Nov 29;20(1):259. doi: 10.1186/s13059-019-1869-y. PMID: 31783898 Free PMC Article

 

Financements :

Institut National du Cancer (INCa)
Agence Nationale de la Recherche (ANR)

 



 

Audrey Lapendry

PhD student in Bio-informatics. ENS de Lyon – LBMC. 

Experience and projects :

Since October 2020, thanks to a “AFM-Téléthon” funding, I am a PhD student in Bioinformatics in the ReGArDS team, under the supervision of Didier Auboeuf. I did my further studies at the “Université Clermont Auvergne”, where I obtained a Bachelor's degree in Cellular Biology and Physiology and a Master's degree in Bioinformatics, Data Analysis and Modelling course.

Many neuromuscular diseases are associated with defects in both gene expression regulation and the cellular metabolism. However, the relationship between these two cellular processes is poorly known. The objective of my thesis is to test whether there is a direct link between amino acid metabolism, more specifically their bioavailability, and the regulation of gene expression, in particular alternative splicing that plays a major role in the differentiation of muscle cells. The results obtained could open new perspectives in terms of understanding the evolution of neuromuscular diseases, but also in terms of therapies that could for example be associated with the intake of particular amino acids through diet.

Before starting my PhD, I spent a year as an engineer within the ReGArDS team. My research work consisted of using and analysing ChIA-PET data. This technology allows to study chromatin interactions at the genome scale. We used this type of data to obtain the lists of exons and genes in interaction, which we stored in a database, in order to facilitate their exploration. Our next objective was to understand why these regions interact. For this, we considered, thanks to statistical analysis, several hypotheses: shared composition biases, regulation by the same splicing factor, etc. This project is still currently under study.

 

Profile:

* Skills:

* Programming languages: Python, Bash, R, SQL, HTML, PHP and JavaScript

* OS / Job schedulers: Linux, Windows & Mac / SGE and Slurm

* Workflow : Nextflow

* Code version manager: Git

 

* Experience:

– Data analysis: ChIP-seq, Hi-C and ChIA-PET

– Use and production of tools for the detection of no-B DNA structures

– Development of bioinformatics analysis pipelines

– Implementation of databases – Development of web interfaces – Statistical analysis

 

Funding:  Association Française contre les Myopathies-Téléthon (AFM-Téléthon) 

 


 

Hélène Polvèche 

Ingénieur d'études en Bio-informatique. IStem – CECS 

Laboratoire d'accueil : ReGarDS - LBMC - ENS de Lyon. 

Créée en 2014 au sein de l’Institut des cellules Souches pour le Traitement et l’Étude des Maladies monogéniques (I-Stem) à Evry, la plateforme NGS & analyses génomiques (https://www.istem.eu/plateformes-technologiques/analysesgenomiques/) est une structure collaborative ouverte aux équipes académiques et a été récemment labellisée Genopole. La plateforme a permis depuis sa création de séquencer différents transcriptomes et d’aider des équipes dans l’analyse de ces projets (Darville et al, EBioMedicine 2016; Cambon et al, Molecular therapy. Methods & clinical development 2017; Galvan et al, Brain 2018; Hoch et al, Sci Rep. 2019). 

Depuis 2015, la plateforme est en collaboration avec l’équipe ReGarDS afin de pérenniser la veille bio-informatique en constante évolution et d’explorer de façon poussée des données issues de séquençage. Ce travail collaboratif a notamment permis l’étude avec l’équipe de C. Martinat, de l’impact de l’épissage alternatif dans la dystrophie myotonique de type 1 (DM1) et d’identifier de nouvelles cibles thérapeutiques (Laustriat et al, Mol Ther Nucleic Acids. 2016, Maury et al, iScience. 2019).

En parallèle de ces projets, la plateforme développe de nouveaux outils de séquençage ou d’analyses bio-informatiques. Par exemple, sont en développement une base de données d’expression génique permettant d’étudier l’expression d’un ou de plusieurs gènes dans différents modèles cellulaires dérivés de cellules souches pluripotentes humaines (https://www.istem.eu/wp-content/uploads/2019/07/Poster_JOBIM2019_2019-06-25_hpolveche.pdf) ou encore une base de données recensant l’effet de l’épissage alternatif de plus d’une 50aine de facteurs d’épissage.

 

Profil :

* Missions : 

- Traitements & Analyses de données (Transcriptomique) issues de NGS RNA-seq / Ampli-seq / Quant-seq (3'-seq) / miRNA-seq 

Données de séquençage : Illumina / Ion Proton 

- Mise en place de Pipelines d'analyses bio-informatiques

- Création d'outils via interfaces web 

* Langages de programmation : 

Bash, Perl, Python, R, HTML, SQL, PHP, Javascript, jQuery 

* Supports / OS : 

HPCC Grid Engine (SGE), Linux Debian - Ubuntu – Windows

 

Publications

- Characterizing the interplay between gene nucleotide composition bias and splicing. (Nov. 2019, Gen. Biology) Lemaire S, et al.  doi: 10.1186/s13059-019-1869-y 

- Physical and functional interaction between SET1/COMPASS complex component CFP-1 and a Sin3S HDAC complex in C. elegans. (Oct. 2019, NAR) Beurton F, et al.  doi: 10.1093/nar/gkz880 

- Interplay between coding and exonic splicing regulatory sequences. (May 2019, Gen. Research) Fontrodona N, Aubé F, et al.  doi: 10.1101/gr.241315.118 

- Human pluripotent stem cell-based drug screening reveals therapeutic potential of repurposable cardiac glycosides in myotonic dystrophy type 1 (Dec. 2018, iScience) Yves Maury, et al.  doi :10.1016/j.isci.2018.12.019