Séquençage monocellulaire et en vrac de l’ARN révèlent un panel multigénique lié à la différenciation cellulaire pour prédire le pronostic et la réponse à l’immunothérapie du carcinome hépatocellulaire
Le carcinome hépatocellulaire (CHC), sixième malignité la plus fréquente et troisième cause de mortalité liée au cancer dans le monde, reste un défi clinique majeur en raison de son diagnostic tardif et d’une hétérogénéité intratumorale marquée. Les facteurs génétiques et environnementaux pilotent l’évolution tumorale, produisant des populations cellulaires mixtes avec des états de différenciation divers issus de cellules souches cancéreuses. Le séquençage de l’ARN en vrac (RNA-seq), bien qu’informatif, moyenne l’expression génique dans les tissus hétérogènes, masquant les variations cellulaires critiques. À l’inverse, le séquençage de l’ARN monocellulaire (scRNA-seq) permet une caractérisation haute résolution des cellules individuelles, révélant leur diversité et leurs trajectoires de différenciation. Cette étude intègre le scRNA-seq et le RNA-seq en vrac pour construire une signature pronostique multigénique liée à la différenciation des cellules de CHC et évaluer son utilité pour prédire les réponses à l’immunothérapie.
Acquisition et intégration des données
Les données de scRNA-seq proviennent du jeu de données GEO GSE146115, incluant 3 200 cellules de quatre échantillons de CHC. Les données de RNA-seq en vrac de 373 tissus de CHC et 49 normaux ont été extraites de TCGA (cohorte d’entraînement), tandis que 225 échantillons de CHC et 220 normaux de GSE14520 ont servi à la validation. Les effets de lot entre jeux de données ont été corrigés via le package R « sva ».
Analyse du profil monocellulaire et de la trajectoire de différenciation
Les données de scRNA-seq ont subi un contrôle qualité strict et une normalisation, conservant les 1 500 gènes les plus variables. L’analyse en composantes principales (ACP) a identifié 20 dimensions significatives utilisées pour la réduction de dimensionnalité par t-SNE. Un clustering non supervisé a divisé les cellules de CHC en 12 clusters (Figure complémentaire 2F–G). Les gènes marqueurs de chaque cluster (log2 fold change [FC] > 0,5, taux de fausse découverte [FDR] < 0,05) sont représentés par une heatmap (Figure complémentaire 2H). L’annotation via « SingleR » a identifié des hépatocytes, monocytes, lymphocytes T et cellules NK (Figure complémentaire 2I–J). L’ordre pseudotemporel (« Monocle ») a reconstruit trois branches de différenciation principales (Figure complémentaire 2K–M), révélant 912 gènes liés à la différenciation cellulaire (HDRGs), enrichis dans les voies de réponse immune, métabolisme et cycle cellulaire (Figure complémentaire 3).
Sous-typage moléculaire et implications pronostiques
Le clustering consensuel de GSE14520 via les HDRGs a stratifié le CHC en trois sous-types moléculaires aux pronostics distincts (Figure complémentaire 4A–B). Le sous-type 1 montrait le pire pronostic, tandis que le sous-type 3 présentait une survie prolongée (Figure complémentaire 4C–D). L’expression des gènes de points de contrôle immunitaires (ICGs) comme PD-L1, CTLA-4 et TIM-3 était élevée dans le sous-type 1 (Figure complémentaire 4E–F, Figure complémentaire 5), confirmant la pertinence clinique des HDRGs.
Construction d’une signature pronostique à sept gènes
Parmi 723 HDRGs communs à TCGA et GSE14520, l’analyse WGCNA a identifié trois modules (jaune, bleu, turquoise) corrélés au grade tumoral (Figure complémentaire 6A–C). L’analyse différentielle a réduit le set à 136 gènes, dont 91 étaient pronostiques (régression de Cox univariée) (Figure complémentaire 6D, Figure complémentaire 7). La régression LASSO a finalement sélectionné sept gènes : DNAH11, RBP7, NQO1, CDH3, MAPT, SAA1 et RARRES1 (Figure complémentaire 8A–B). Les scores de risque basés sur ces gènes ont stratifié les patients en groupes à risque élevé et faible.
Validation du modèle pronostique
Dans TCGA, les patients à haut risque montraient une survie globale (OS) plus courte (HR = 2,32, P < 0,001) (Figure complémentaire 9A). La robustesse du modèle a été confirmée dans GSE14520 (HR = 1,87, P = 0,003) (Figure complémentaire 9B). Les courbes ROC ont démontré une précision prédictive élevée pour l’OS à 1, 3 et 5 ans (AUC = 0,76, 0,73 et 0,71 dans TCGA ; 0,68, 0,65 et 0,63 dans GSE14520) (Figure complémentaire 9C–D). L’analyse multivariée a confirmé le score de risque comme facteur pronostique indépendant (HR = 1,92, P < 0,001) (Figure complémentaire 10A–B). Un nomogramme intégrant le score de risque et le stade tumoral a amélioré l'utilité clinique (Figure complémentaire 10C–E).
Paysage immunitaire et implications thérapeutiques
Les patients à haut risque présentaient une infiltration accrue de lymphocytes B, CD4+, neutrophiles, macrophages et cellules NK activées (Figure complémentaire 11A). Paradoxalement, 26 ICGs (dont PD-1, PD-L1, LAG-3) étaient surexprimés dans ce groupe (Figure complémentaire 11B), suggérant un microenvironnement immunosuppresseur. Une charge mutationnelle tumorale (TMB) élevée était associée à une survie réduite (Figure complémentaire 12A–C). L’analyse TIDE a prédit une meilleure réponse à l’immunothérapie pour les patients à haut risque, avec des scores TIDE bas, une instabilité microsatellitaire élevée et une expression accrue d’interféron-gamma et PD-L1 (Figure complémentaire 12D–K). Cette signature septigénique émerge ainsi comme biomarqueur pour identifier les patients susceptibles de bénéficier d’un blocage des points de contrôle immunitaires.
Enrichissement fonctionnel et analyse de voies
L’analyse GSEA a révélé 16 voies oncogéniques enrichies chez les patients à haut risque, incluant la transition épithélio-mésenchymateuse, l’hypoxie et la réponse inflammatoire (Figure complémentaire 13), corroborant la pertinence biologique du modèle.
Conclusions
En intégrant le scRNA-seq et le RNA-seq en vrac, cette étude identifie une signature génique liée à la différenciation cellulaire qui prédit robustement le pronostic et la réponse à l’immunothérapie du CHC. Le panel de sept gènes offre un outil novateur pour la stratification du risque et les décisions thérapeutiques, soulignant l’interaction entre hétérogénéité tumorale, évasion immune et résistance aux traitements.
doi.org/10.1097/CM9.0000000000002393