Aller au contenu. | Aller à la navigation

Outils personnels

Navigation
Vous êtes ici : Accueil / Services Communs / Pôle Biocomputing / projects list / 2020 Mapping Noise (Finished)

2020 Mapping Noise (Finished)

Identification de mutations affectant la variabilité d’expression par BSA-Seq. A partir des données de séquençage d’ADN génomique obtenues, ce projet a pour but de répondre aux questions suivantes : Quelles mutations sont présentes dans le génome des mutants analysés ? (position et nature des mutations) Parmi ces mutations, lesquelles sont associées à des différences de variabilité d’expression du rapporteur fluorescent placé sous contrôle du promoteur TDH3 ? L’approche utilisée pour répondre à la deuxième question étant une approche de « bulk segregant analysis », cette question peut être décomposée en deux sous-questions : 2.1) Quelle est la fréquence de chaque mutation par rapport à l’allèle sauvage dans chacun des trois « bulks » analysés pour chaque mutant ? 2.2) Est-ce que cette fréquence est statistiquement différente dans un des « bulks » par rapport aux deux autres ?

RESULTS

This project lead to the developpement of a dedicated pipline by a student available at the following url:

https://gitbio.ens-lyon.fr/LBMC/gylab/MappingNoise

Rapport de stage

Porteur du projet

Fabien DUVEAU, équipe Yvert

Personnes

Julie Kleine-Schultjann (stagiaire en 1ère année Bioinfo et Modélisation à l’INSA), Laurent Modolo, Fabien Duveau

Problématique biologique

Le développement d’approches permettant de quantifier le niveau d’ARN ou de protéines de cellules uniques a mis en évidence une grande diversité d’expression entre cellules génétiquement identiques cultivées dans un environnement contrôlé. Cependant, les facteurs génétiques régulant cette variabilité d’expression sont mal connus, ainsi que leurs mécanismes d’actions. Ce projet a pour but d’identifier des mutations aléatoires dans le génome de la levure S. cerevisiae qui affectent la variabilité d’expression d’un gène (gène TDH3 utilisé comme modèle). Pour cela, des cellules exprimant le rapporteur fluorescent YFP sous contrôle du promoteur du gène TDH3 ont été soumises à une mutagenèse à l’EMS. Plusieurs clones mutants ont été isolés et le niveau de fluorescence de milliers de cellules a été mesuré par cytométrie en flux pour chaque mutant. Cela a permis d’isoler 6 mutants dont la variabilité de fluorescence entre cellules est différente de la souche sauvage. Afin d’identifier quelles mutations sont responsables de ces changements de variabilité, une approche de BSA-Seq (Bulk Segregant Analysis followed by deep sequencing) a été utilisée, où chaque ‘bulk’ correspond à un sous-ensemble de cellules triées par FACS. Le but du projet est de mettre en place une pipeline d’analyse des données de séquençage afin d’identifier les mutations impliquées.

Questions

A partir des données de séquençage d’ADN génomique obtenues, ce projet a pour but de répondre aux questions suivantes :

Quelles mutations sont présentes dans le génome des mutants analysés ? (position et nature des mutations)

Parmi ces mutations, lesquelles sont associées à des différences de variabilité d’expression du rapporteur fluorescent placé sous contrôle du promoteur TDH3 ?

L’approche utilisée pour répondre à la deuxième question étant une approche de « bulk segregant analysis », cette question peut être décomposée en deux sous-questions :

2.1) Quelle est la fréquence de chaque mutation par rapport à l’allèle sauvage dans chacun des trois « bulks » analysés pour chaque mutant ?

2.2) Est-ce que cette fréquence est statistiquement différente dans un des « bulks » par rapport aux deux autres ?

Données

Données attendues en mai 2020 :

Nous allons faire séquencer le génome des 6 souches mutantes de levure impliquées dans ce projet. Les données correspondront à 6 librairies d’ADN génomique séquencées sur un Miseq (PE250 reads). Ces données serviront à identifier l’ensemble des mutations présentes dans le génome des 6 mutants haploïdes. En cas d’absence de ces données, il sera toujours possible d’identifier les mutations à partir des données de BSA-Seq décrites ci-dessous, bien que plus difficile car les mutations y sont présentes à des fréquences intermédiaires.

Données de BSA-Seq déjà collectées :

Les données de BSA-Seq correspondent à trois librairies d’ADN génomique pour chacun des 6 mutants séquencées sur une lane de HiSeq 4000 en PE150 (avec 36 autres librairies sur la lane non utilisées dans ce projet). Ces librairies ont été obtenues comme suit. Chaque mutant haploïde a été croisé avec une souche sauvage, puis la méiose a été induites dans 108 cellules diploïdes et 106 spores du même type sexuel ont été collectées par FACS. Après ~7 générations de culture, 3 « bulks » de ségrégants ont été triés par FACS : un « low bulk » de 105 cellules dont le niveau de fluorescence est dans le 1er percentile de la population, un « high bulk » de 105 cellules dont le niveau de fluorescence est dans le dernier percentile de la population et un « middle bulk » de 105 cellules dont le niveau de fluorescence est compris entre les 40ème et 60ème percentiles de la population. Ces trois bulks ont ensuite été cultivés pendant ~7 générations, l’ADN génomique de chaque bulk extrait et 1 ng d’ADN a servi pour préparer chaque librairie avec le kit Nextera XT d’Illumina (12 x 8 index utilisées pour le multiplexing). Les librairies ont été séquencées sur la plateforme de séquençage de l’Université du Michigan, qui nous a renvoyé les fichiers de reads démultiplexés en format fastq pour chaque librairie.

Date

La date du début du projet : 18/06/2020
La date d’obtention des données : 14/01/2016
La date d’obtention de l’intégralité des données : mai 2020
La date souhaitée de fin du projet : 11/09/2020

Attentes

Afin d’atteindre les objectifs de ce projet, l’idée serait de mettre en place le co-encadrement d’une stagiaire par Fabien Duveau et Laurent Modolo. Cela permettrait à la stagiaire d’apprendre à développer une pipeline d’analyse de données NGS et à Fabien de se familiariser concrètement avec les bonnes pratiques promulguées par le hub de bioinfo. Dans cette optique, une stagiaire prometteuse et volontaire (Julie Kleine-Schultjann) rejoindra le labo cet été du 18/06/2020 au 11/09/2020 avec une interruption du 12/07 au 17/08. Ce projet s’inscrit dans le cadre d’une collaboration entre l’équipe Yvert et l’équipe de Patricia Wittkopp à l’Université du Michigan dans laquelle Fabien Duveau a généré ces données lors de son postdoctorat. Nous espérons que cette analyse donnera lieu à une publication avec les différentes personnes impliquées (Julie Kleine-Schultjann, Laurent Modolo, Gaël Yvert, Patricia Wittkopp, autres) que Fabien Duveau pourra signer en dernier auteur et ainsi « lancer » sa route vers l’HDR et l’obtention de financements.