La convergence phénotypique, c’est-à-dire l’acquisition indépendante de caractères similaires par des espèces différentes, est omniprésente dans la nature et a été souvent étudiée. Mais ce processus évolutif n'est pas bien compris. Par exemple, de nombreux chercheurs cherchent à comprendre s’il existe des bases génétiques convergentes sous-jacentes à ces convergences phénotypiques.
Quelques substitutions convergentes corrélées à un phénotype convergent ont été décrites dans la littérature, mais il existe peu d'études à l'échelle génomique. Ceci peut s'expliquer par deux problèmes méthodologiques: 1/ D'une part, la difficulté de créer des jeux de données multi-espèces pour des analyses comparatives. 2/ D'autre part, le manque de méthodes dédiées à la détection de la convergence à l’échelle génomique.
Au cours de ma thèse, j’ai proposé des solutions à ces deux défis. Dans un premier temps, j’ai créé un programme (CAARS) permettant d'automatiser l’assemblage de jeux de données composés de familles d'orthologues à partir de données RNA-Seq. Puis j’ai créé un outil (PCOC) pour étudier les substitutions convergentes au sein de séquences codantes, basé sur l’identification de changements de profils d'acides aminés. Ces outils ont été développés dans un souci de reproductibilité et de facilité d'utilisation. J’ai ensuite étudié la capacité de différentes méthodes, dont PCOC, à détecter des substitutions convergentes en présence de facteurs confondants. Enfin, j’ai appliqué ces méthodes à un cas biologique où j’ai cherché à caractériser les bases génomiques de l'adaptation aux milieux arides chez les rongeurs.
Gratuit
Disciplines