Doctoral thesis
OA Policy
English

Benchmarking in (meta-) genomics: LEMMI & BUSCO

ContributorsSeppey, Mathieuorcid
Defense date2020-08-24
Abstract

La quantité d'informations obtenue lors de l'étude de génomes augmente de façon constante. La complexité des processus de séquençage conduit à des données imparfaites avec un niveau élevé de bruit. Celles-ci nécessitent une variété de méthodes pour donner une interprétation biologique à leur contenu. Comme certains résultats reflètent mieux la réalité que d'autres, des stratégies pour juger de la qualité des données et des performances des méthodes informatiques sont nécessaires pour guider les choix expérimentaux. Ces évaluations doivent être systématiques et reproductibles. J'explore ici deux aspects liés à l'évaluation de processus informatiques dédiés à la recherche biologique, ainsi que de leurs résultats. Ils sont abordés au travers de deux ressources bio-informatiques distinctes dédiées à l'évaluation des performances (benchmark). i) La plate-forme LEMMI fournit une évaluation continue des outils de classification taxonomique. ii) Le logiciel BUSCO utilise des gènes conservés universellement pour évaluer le niveau de complétion de séquences génomiques.

Keywords
  • Bioinformatique
  • Génomique
  • Métagénomique
  • Benchmarking
  • Reproductibilité
Citation (ISO format)
SEPPEY, Mathieu. Benchmarking in (meta-) genomics: LEMMI & BUSCO. Doctoral Thesis, 2020. doi: 10.13097/archive-ouverte/unige:143927
Main files (1)
Thesis
accessLevelPublic
Identifiers
350views
74downloads

Technical informations

Creation20/10/2020 14:34:00
First validation20/10/2020 14:34:00
Update time19/03/2024 16:52:49
Status update19/03/2024 16:52:49
Last indexation31/10/2024 20:10:31
All rights reserved by Archive ouverte UNIGE and the University of GenevaunigeBlack