Construction et évaluation du score de risque polygénique fonctionnel pour le cancer gastrique dans une cohorte prospective de la population européenne
Le cancer gastrique demeure un problème de santé mondial majeur, avec une prédisposition génétique jouant un rôle crucial dans son développement. Les scores de risque polygénique (PRS), qui agrègent les effets de multiples variants génétiques, sont des outils prometteurs pour prédire le risque individuel de maladie. Cependant, la transférabilité des PRS entre populations d’origines ethniques distinctes reste un défi en raison des différences d’architecture génétique, de fréquences alléliques et de motifs de déséquilibre de liaison (LD). Cette étude aborde cette problématique en construisant et évaluant un PRS fonctionnel (fPRS) pour le cancer gastrique dans une population européenne, en exploitant des polymorphismes nucléotidiques fonctionnels (fSNPs) pour améliorer l’applicabilité interpopulations.
Introduction
Le génotype représente l’un des facteurs génétiques les plus précoces, stables et mesurables influençant les traits complexes. Comprendre la relation entre génotype et phénotype reste une question centrale en génétique. Les études d’association pangénomique (GWAS) ont identifié de nombreux variants associés à des maladies complexes, dont le cancer gastrique. Un PRS, intégrant les contributions de ces variants, principalement des SNPs, reflète la prédisposition génétique individuelle à une maladie. Ainsi, les PRS servent de marqueurs précoces pour des interventions personnalisées ou des dépistages ciblés.
Cependant, la précision d’un PRS dépend de la représentativité de la population d’étude dans la GWAS d’entraînement. Les variations de LD entre populations exacerbent les biais lors de l’extrapolation des PRS. Par exemple, la précision des prédictions génétiques est moindre pour les populations non européennes. Évaluer la transférabilité des PRS et investir dans des GWAS multi-ethniques sont donc essentiels.
Malgré les divergences interethniques des GWAS, les régions de risque associées aux maladies se recoupent souvent, suggérant des composantes génétiques partagées. Les associations génétiques dans différentes populations pourraient être portées par des SNPs causaux communs, masqués par des variants différents selon les populations. L’intégration d’annotations fonctionnelles (sites de fixation de facteurs de transcription, marques histone, boucles d’ADN) aux données GWAS a permis d’identifier des variants fonctionnels impliqués dans les maladies. Les fSNPs pourraient améliorer la portabilité trans-ancestrale des PRS.
Cette étude s’appuie sur un PRS précédent (PRS-112) dérivé de 112 SNPs issus d’une méta-analyse de six GWAS sur le cancer gastrique dans une population chinoise. Bien que validé dans une cohorte chinoise, sa performance dans d’autres populations reste inconnue. Les auteurs ont donc développé un fPRS basé sur des fSNPs identifiés via des annotations fonctionnelles in silico, évalué dans la cohorte européenne UK Biobank, avec des analyses combinant facteurs génétiques et mode de vie.
Méthodes
Population et conception de l’étude
Les données proviennent de l’UK Biobank, incluant 457 521 participants d’origine britannique, irlandaise ou européenne, suivis jusqu’en juillet 2019. Les cas de cancer gastrique ont été identifiés via les registres nationaux de santé.
Annotations fonctionnelles
Les SNPs en LD fort avec les 112 SNPs index du PRS-112 ont été annotés pour leur impact sur la régulation transcriptionnelle ou la structure protéique, en utilisant des bases de données publiques (marques histone, sites de fixation de facteurs de transcription, interactions chromatiniennes, eQTL). Les SNPs ont été classés selon leur impact fonctionnel.
Calcul des PRS
Le fPRS a été construit via le modèle LDpred2-infinitesimal, ajustant les effets des SNPs par régression du score de LD dans la population cible. Le PRS-112 et deux versions de fPRS (fPRS-125 avec 125 fSNPs ; fPRS-24 avec 24 fSNPs indépendants) ont été calculés.
Facteurs de mode de vie
Quatre facteurs sains (non-tabagisme, absence de consommation d’alcool, alimentation riche en fruits/légumes, activité physique régulière) ont été évalués. Les participants ont été classés en trois groupes selon le nombre de facteurs adoptés.
Analyses statistiques
Des modèles de Cox ont estimé les associations entre PRS et risque de cancer gastrique, ajustés sur l’âge, le sexe, le tabagisme, la consommation d’alcool et les composantes principales d’ascendance. Les courbes ROC ont évalué la performance discriminative des modèles.
Résultats
Performance du PRS-112 en population européenne
Sur 4 582 045 personnes-années de suivi, 623 cas de cancer gastrique ont été identifiés. Le PRS-112 n’a montré aucune association significative avec le risque (HR = 1,00 ; IC 95 % 0,93–1,09 ; P = 0,846), sans tendance linéaire entre quintiles (Ptrend = 0,872).
Identification de 125 fSNPs
Les annotations fonctionnelles ont identifié 125 fSNPs, dont sept affectant la structure protéique et 118 impliqués dans la régulation transcriptionnelle. Trois fSNPs chevauchaient les SNPs index du PRS-112. Les fSNPs incluaient des variants dans les gènes HLA, C1QTNF9, QR2J3 et NOC3L. Dix SNPs étaient situés dans des promoteurs, et 117 dans des régions distales. Une enrichissement en sites de fixation pour STAT1, YY1 et ZNF263 a été observé.
Performance du fPRS-125
Le fPRS-125 était significativement associé au risque de cancer gastrique (HR = 1,11 ; IC 95 % 1,03–1,20 ; P = 0,009). Les participants du quintile supérieur présentaient un risque 1,43 fois plus élevé que le quintile inférieur (HR = 1,43 ; IC 95 % 1,12–1,84 ; P = 0,005). Le fPRS-24 montrait également une association favorable (HR = 1,10 ; P = 0,019). Un PRS dérivé de 176 non-fSNPs était non prédictif (HR = 1,05 ; P = 0,190).
Combinaison fPRS-125 et mode de vie
Un mode de vie défavorable augmentait le risque (HR = 1,78 ; IC 95 % 1,20–2,63 ; P = 0,004). Les participants cumulant un risque génétique élevé et un mode de vie défavorable présentaient le risque le plus élevé (HR = 4,99 ; IC 95 % 1,55–16,10 ; P = 0,007).
Discussion
Le PRS-112 chinois n’était pas transférable en population européenne, probablement en raison de différences de LD, de fréquences alléliques et d’effets génétiques. En revanche, le fPRS-125, basé sur des fSNPs, a démontré une portabilité trans-ancestrale significative, identifiant efficacement les individus à haut risque. Son effet combiné avec les facteurs de mode de vie souligne l’importance d’une approche intégrative pour la prédiction du risque.
Les limitations incluent le focus sur les annotations transcriptionnelles, la nécessité de valider la portabilité du fPRS-125 dans d’autres cohortes, et l’exploration incomplète des mécanismes moléculaires sous-jacents.
En conclusion, le fPRS-125 constitue un outil prometteur pour l’évaluation du risque génétique de cancer gastrique en population européenne. Son intégration avec les facteurs environnementaux offre une approche personnalisée pour le dépistage précoce et les interventions préventives.
doi.org/10.1097/CM9.0000000000002716