Développement de méthodes bioinformatiques pour la caractérisation d’organismes génétiquement modifiés par séquençage de nouvelle génération


  • Hulin, J. (2017). Développement de méthodes bioinformatiques pour la caractérisation d’organismes génétiquement modifiés par séquençage de nouvelle génération. Mémoire,
Type Thesis
Year 2017
Title Développement de méthodes bioinformatiques pour la caractérisation d’organismes génétiquement modifiés par séquençage de nouvelle génération
Label U16-memoire-Hulin-2017
Thesis type Mémoire
Endnote Keywords GMO detection, Next Generation sequencing, Bioinformatic
Abstract Le nombre d'organismes génétiquement modifiés (OGM) de type plante augmente chaque année. Cette augmentation a entraîné la mise en place d'une législation sur la traçabilité des OGM et le développement de techniques de détection et d'identification ad hoc. Les techniques actuellement utilisées, comme la PCR, permettent l'identification des constructions OGM en se basant sur les éléments de construction composant les transgènes. Ces techniques d'identification atteignent toutefois leurs limites avec l'apparition d'OGM dont les éléments de constructions ne sont pas documentés. Afin de pallier ce problème, le CRA?W, en collaboration avec la plateforme de génomique du GIGA, est occupé à développer des méthodes de caractérisation et de détection d’OGM mettant à profit le séquençage de nouvelle génération (NGS). Deux projets pilotes ont été réalisés dans ce cadre. L'objectif général de ce mémoire est d'analyser les données ainsi générées afin d'évaluer l'intérêt potentiel de ces deux approches. Le volet principal de ce mémoire correspond à l'analyse de données obtenues par séquençage pour des échantillons de différentes espèces végétales (papaye, soja, riz, …) ainsi que des mélanges OGM/non-OGM en différentes proportions. Ces échantillons ont été séquencés après enrichissement à l’aide de sondes spécifiques de cibles correspondant à des séquences classiquement utilisées pour la génération d’OGM (promoteurs, terminateurs et gènes). Après la caractérisation des séquences des sondes ayant servi pour l'enrichissement, deux stratégies d'analyse ont été testées pour traiter ces données de séquençage. Une première stratégie a consisté en l'identification des éléments de construction présents dans les transgènes par un alignement des reads issus du séquençage sur un génome de référence comprenant les séquences des sondes d'enrichissement. Une seconde stratégie, a quant à elle, visé à reconstituer la séquence des transgènes par l'assemblage en contigs des reads issus du séquençage. Le second volet de ce mémoire est dédié à l’évaluation d'une nouvelle méthode permettant l’amplification d’une cible d’intérêt ainsi que des loci environnants. L'analyse de ces données de séquençage a montré que cette technique permet d'identifier et caractériser les sites d'insertion pour les OGM dont la séquence transgénique est disponible. Cependant, les résultats obtenus par cette étude quant à son application en vue de l'identification d'OGM dont le transgène est inconnu, ont montré que l'application de cette méthode sur les plantes nécessiterait davantage d'optimisation au niveau des protocoles expérimentaux appliqués pour obtenir les données. Afin de traiter ces données, une série de pipelines d'analyses ont été mis au point. L'ensemble des résultats obtenus pour ces deux projets pilotes a permis de mieux cerner les applications possibles des NGS dans le cadre de l'identification des OGM et de mettre en évidence certains éléments dont il faudra tenir compte au cours des futures analyses.
File
Authors Hulin, J.