Amélioration minime de la prédiction du risque de maladie coronarienne dans la population chinoise à l’aide de scores de risque polygénique : données de la China Kadoorie Biobank
La maladie coronarienne (CAD) reste une cause majeure de morbidité et de mortalité mondiale, avec une prévalence croissante en Chine. Les modèles traditionnels de prédiction du risque, comme le modèle China-PAR, reposent sur des facteurs non biologiques tels que l’âge, le sexe, la pression artérielle, le tabagisme et le diabète. Cependant, ces modèles présentent des limites en précision, motivant l’intérêt pour l’intégration d’informations génétiques comme les scores de risque polygénique (PRS). Bien que les PRS aient montré des résultats prometteurs dans les populations européennes, leur utilité dans les populations non européennes, notamment chinoises, reste peu explorée. Cette étude évalue le potentiel des PRS pour améliorer la prédiction du risque de CAD dans la population chinoise en utilisant les données de la China Kadoorie Biobank (CKB), une cohorte prospective de grande ampleur.
Conception de l’étude et population
La CKB a inclus 512 725 participants âgés de 30 à 79 ans provenant de 10 régions chinoises entre 2004 et 2008. Un sous-ensemble de 100 640 participants avec des données génotypiques à l’échelle du génome a été analysé. Après exclusion des individus présentant une maladie cardiovasculaire (MCV) à l’inclusion, 72 150 participants ont formé l’ensemble de test pour les analyses prospectives. Un ensemble d’entraînement de 28 490 participants, incluant des échantillons de cas-témoins et des cas de CAD à l’inclusion, a servi à développer et valider les PRS. Le suivi moyen était de 11,2 ans, avec des événements identifiés via des registres nationaux et des bases de données d’assurance.
Définitions des critères de jugement
Deux critères de jugement ont été analysés :
- CAD sévère : Infarctus du myocarde non mortel (codes CIM-10 I21–I23) ou CAD mortel (I20–I25).
- CAD non sévère : Tous les événements de CAD mortels ou non mortels (I20–I25).
Développement et validation des PRS
PRS existants
Dix PRS publiés antérieurement ont été évalués, incluant des modèles dérivés d’études GWAS européennes et est-asiatiques. Parmi eux :
- MetaPRS_CAD (PGS000337) : Développé à partir de CARDIoGRAMplusC4D, UK Biobank (UKB) et Biobank Japan (BBJ).
- PRS-CHD (PGS000329) et GPS-CAD (PGS000013) : Basés sur des cohortes européennes.
Construction de nouveaux PRS
Deux méthodes ont été utilisées :
- Clumping & Thresholding (C+T) : Variants regroupés (seuil de déséquilibre de liaison r² = 0,2–0,8) et filtrés par seuils de significativité (P = 5×10⁻⁸ à 1).
- LDpred : Méthode bayésienne corrigeant le biais de liaison et supposant une fraction de variants causaux.
Les statistiques sommaires de la méta-analyse UKB-CARDIoGRAMplusC4D (UCM ; 1,2 million d’Européens) et de BBJ (194 427 Est-Asiatiques) ont été utilisées. Les PRS optimisés dans l’ensemble d’entraînement (meilleur rapport de cotes par déviation standard [OR/ET]) ont été sélectionnés pour le test.
Analyse statistique
Dans l’ensemble de test, des modèles de Cox ont évalué les associations PRS-CAD, ajustés sur les composantes principales et la puce de génotypage. La discrimination a été mesurée par l’indice C de Harrell, l’étalonnage par des courbes de risque prédit/observé, et la reclassification par le NRI (Net Reclassification Improvement) et l’IDI (Integrated Discrimination Improvement). Les modèles traditionnels (sexe-spécifiques, stratifiés par région) incluaient l’âge, la pression artérielle, le tabagisme, le diabète et le tour de taille.
Résultats clés
Performance des PRS dans l’ensemble d’entraînement
- CAD sévère : MetaPRS_CAD (PGS000337) montrait l’association la plus forte (OR/ET = 1,21, IC 95 % : 1,15–1,27), suivi du PRS dérivé par LDpred (OR/ET = 1,19).
- CAD non sévère : Le PRS LDpred (LD-UCM-004) était le plus performant (OR/ET = 1,12).
Validation prospective dans l’ensemble de test
- CAD sévère : 1 214 événements. MetaPRS_CAD avait un rapport de risque par ET (HR/ET) de 1,26 (1,19–1,33).
- CAD non sévère : 7 201 événements. MetaPRS_CAD avait un HR/ET de 1,11 (1,09–1,14).
Amélioration de la prédiction du risque
L’ajout de MetaPRS_CAD aux modèles traditionnels a apporté des améliorations minimes :
- CAD sévère :
- L’indice C augmentait de 0,001 (femmes) et 0,003 (hommes).
- Reclassification : Au seuil de risque de 10 %, le NRI catégoriel était de 3,2 % (0,4–6,0 %) chez les femmes et 2,0 % (0,7–3,2 %) chez les hommes.
- CAD non sévère :
- L’indice C augmentait de 0,001 dans les deux sexes.
- Les NRI étaient négligeables (≤1 %), sans reclassification significative.
Analyse de sous-groupes
Les associations PRS-CAD étaient homogènes selon l’âge, le sexe, le tabagisme et les comorbidités métaboliques. Cependant, l’effet des PRS était plus marqué chez les individus avec antécédents familiaux de MCV (HR/ET pour CAD non sévère = 1,23 vs 1,09 ; P = 0,017).
Discussion
Utilité limitée en population chinoise
Malgré des associations robustes entre PRS et risque de CAD, l’amélioration prédictive par rapport aux modèles traditionnels reste marginale. Ce constat contraste avec les études européennes, où les PRS augmentaient l’indice C jusqu’à 0,03. Explications possibles :
- Effets génétiques plus faibles : Le HR/ET de MetaPRS_CAD (1,26) était inférieur à celui observé chez les Européens (jusqu’à 1,62).
- Hétérogénéité des critères : Le CAD non sévère (85 % des événements), incluant l’angine et l’ischémie chronique, pourrait avoir des bases génétiques moins marquées.
- Performance des modèles traditionnels : Ces modèles, même sans données lipidiques (exclues pour des raisons pratiques), capturaient déjà une part importante du risque.
Implications cliniques et de santé publique
L’amélioration minime de la stratification interroge sur le rapport coût-efficacité du dépistage par PRS en Chine. Cependant, les PRS pourraient bénéficier aux sous-groupes à haut risque, comme ceux avec antécédents familiaux. L’intégration future de profils lipidiques, de biomarqueurs innovants et de PRS spécifiques à l’ascendance pourrait améliorer les performances.
Forces et limites
Les forces incluent la taille de l’échantillon, le suivi prolongé et le génotypage rigoureux. Les limites comprennent :
- L’absence de données lipidiques dans les modèles traditionnels.
- L’hétérogénéité des sous-types de CAD (ex. angine) pouvant diluer les signaux génétiques.
- La transférabilité limitée des PRS dérivés de populations européennes.
Conclusion
Cette étude démontre que les PRS actuels, bien qu’associés au risque de CAD, n’apportent qu’une amélioration minime de la prédiction du risque dans la population chinoise. Ces résultats soulignent la nécessité de développer des études GWAS spécifiques à l’ascendance et d’optimiser les modèles de risque avant une utilisation clinique des PRS.
doi.org/10.1097/CM9.0000000000002694