2018 flexi_splitter (Finished)
Results
This project lead to the developpement of the `flexi_splitter` tool available on `pip` and on the following url:
https://gitbio.ens-lyon.fr/LBMC/RMI2/flexi_splitter
Porteur du projet
Emmanuel Labaronne
Personnes
Emmanuel Labaronne
Problématique biologique
Nous construisons nous même nos banques pour le séquençage haut-débit d’ARN. Nous utilisons un design particulier qui nous permet d’intégrer deux barcodes différents : un pendant l’étape de rétrotranscription et le second pendant la PCR. L’intégration de ces barcodes nous permet de pouvoir mélanger plusieurs échantillons au sein d’un même run de séquençage. Lors de l’analyse du séquençage, nous pouvons donc séparer les reads en fonction de leur barcode pour retrouver l’échantillon d’origine. Les outils déjà disponibles pour séparer les reads en fonction de leur barcode ne sont pas adaptés à la construction de nos propore banques et leur utilisation devient compliquée ralentissant fortement le temps de calcul.
Questions
Le but de se projet serait de développer un outil informatique capable de séparer les reads en fonction des deux barcodes utilisés. Le programme doit pouvoir séparer aussi bien les données issus de séquençage single-end que paired-end à partir d’un fichier de configuration donné par l’utilisateur indiquant le nom de l’échantillon et les barcodes utilisés.
Un second point optionnel mais fortement souhaité serait la gestion des mismatchs en fonction de la qualité du séquençage, ce qui permet de gérer au mieux les incertitudes liés au séquençage.
Données
Des données de séquençage issue de Ribosome Profiling (single end) et de RNA seq (paired-end)
Date
La date du début du projet : 1/12/2018
La date souhaitée de fin du projet : au plus tard mars 2020
Attentes
Aide pour l’écriture du programme ainsi que pour le développement de l’algorythme.