Guide de la recherche sur le microbiome humain : conception de l’étude, collecte d’échantillons et analyse bioinformatique
Introduction
Le microbiome humain est devenu un domaine de recherche critique ces dernières années, grâce aux progrès des technologies de séquençage et des méthodes d’analyse des données. Des découvertes majeures ont établi des liens entre le microbiome et diverses pathologies, telles que les troubles métaboliques, les maladies digestives et les affections cardiovasculaires. Ces résultats ont suscité un intérêt croissant parmi les chercheurs médicaux, entraînant une augmentation des publications dans ce domaine. Cependant, la complexité des méthodes bioinformatiques et statistiques utilisées dans la recherche sur le microbiome représente un défi pour les chercheurs sans expertise en bioinformatique. Cette revue propose un guide complet couvrant la conception des études, la collecte d’échantillons, l’analyse statistique et les pipelines bioinformatiques.
Concepts fondamentaux
Le microbiote désigne l’ensemble des microorganismes (bactéries, archées, virus, champignons, protozoaires) colonisant un site spécifique du corps. Le microbiome inclut non seulement ces microorganismes, mais aussi leurs génomes et leur environnement. Le métagénome représente l’ensemble des génomes du microbiote, obtenu par séquençage métagénomique shotgun. Le virome correspond à l’ensemble des virus associés à l’humain, étudié via la métagénomique virale.
La taxonomie bactérienne hiérarchise les microorganismes en phylums, classes, ordres, familles, genres et espèces. Les Unités Taxonomiques Opérationnelles (UTO) regroupent des séquences d’ADN avec 97 % de similarité, tandis que les Variantes de Séquence d’Amplicon (ASV) offrent une résolution à un nucléotide près.
La diversité alpha mesure la richesse microbienne au sein d’un échantillon (indices de Chao 1, Shannon-Wiener, Simpson). La diversité bêta compare la dissimilarité entre échantillons (indices de Bray-Curtis, distance UniFrac), visualisée par des méthodes d’ordination (ACP, ACpCo).
Conception de l’étude
Les designs courants incluent les études transversales (exploratoires), cas-témoins, longitudinales et les essais randomisés contrôlés (ERC). Les facteurs confondants (âge, sexe, régime alimentaire, médicaments) doivent être contrôlés. Le calcul de la taille d’échantillon, basé sur des tests statistiques (t-test, ANOVA, modèle de Dirichlet multinomial), est crucial pour garantir une puissance statistique suffisante.
Les méthodes de séquençage comprennent :
- Séquençage d’amplicons (ARNr 16S/ITS) : économique, résolution limitée au genre.
- Métagénomique shotgun : résolution espèce, informations fonctionnelles.
- Métatranscriptomique : étude de l’expression génique active, techniquement complexe.
Types d’échantillons, préservation et stockage
Les échantillons varient selon la question de recherche : selles, liquide de lavage colique, biopsie cutanée, etc. La congélation immédiate (-20 °C) puis le stockage à -80 °C sont recommandés. Des kits de préservation permettent un stockage à température ambiante pour les collectes à domicile.
Analyse statistique
Les analyses multivariées (PERMANOVA, test de Mantel) comparent la diversité bêta et corrèlent le microbiome avec des métadonnées. Les corrections de multiples tests (Bonferroni, Benjamini-Hochberg) contrôlent les faux positifs.
Analyses bioinformatiques
- Analyse des gènes marqueurs : traitement des données brutes (QIIME 2, VSEARCH) et classification taxonomique.
- Métagénomique : contrôle qualité, profilage taxonomique (MetaPhlAn), annotation fonctionnelle via KEGG, CAZy.
- Intégration multi-omiques : combinaison avec des données métabolomiques ou transcriptomiques.
Rôle du virome dans les maladies humaines
Le virome influence la santé humaine, mais son étude est limitée par l’annotation des séquences virales inconnues et l’absence de contrôles positifs commerciaux. Son intégration avec d’autres approches omiques reste prometteuse.
Résumé et conclusions
Cette revue souligne l’importance d’une conception rigoureuse, de méthodes statistiques adaptées et de pipelines bioinformatiques robustes. Les recommandations pratiques et les outils décrits visent à faciliter l’adoption des méthodes avancées d’analyse du microbiome par les chercheurs cliniques.
doi.org/10.1097/CM9.0000000000000871