Un modèle d’apprentissage automatique pour le diagnostic de l’embolie pulmonaire aiguë et comparaison avec le score de Wells, le score de Genève révisé et l’algorithme de YEARS
Contexte et justification
L’embolie pulmonaire aiguë (EPA) est une maladie cardiovasculaire potentiellement mortelle, se classant au troisième rang mondial après les cardiopathies ischémiques et les accidents vasculaires cérébraux. Malgré sa gravité, l’EPA est souvent manquée ou mal diagnostiquée en raison de symptômes et signes non spécifiques. Un diagnostic précoce et précis est essentiel pour un traitement efficace, mais les stratégies actuelles restent controversées et difficiles à appliquer en pratique clinique. Cette étude vise à développer un modèle d’apprentissage automatique (AA) pour le diagnostic de l’EPA et à comparer ses performances aux outils d’évaluation probabiliste existants : le score de Wells, le score de Genève révisé et l’algorithme de YEARS.
Méthodes
Il s’agit d’une analyse rétrospective monocentrique menée à l’hôpital sino-japonais de l’amitié (Pékin, Chine). Les patients suspects d’EPA ayant subi une tomodensitométrie pulmonaire (angioscanner) entre janvier 2019 et décembre 2019 ont été inclus. Les critères d’exclusion incluaient des pathologies telles que l’artérite de Takayasu ou des données incomplètes. Sur 454 patients inclus, 340 ont formé le set d’entraînement et 114 le set de test. Un set de validation interne supplémentaire (n=204) provenait de données de 2018.
Les données collectées incluaient des caractéristiques démographiques, cliniques, biologiques (ex. D-dimères, troponine T) et des biomarqueurs cardiaques. La sélection des caractéristiques a réduit 27 variables initiales à 8 : D-dimères, troponine T, saturation en oxygène, fréquence cardiaque, douleur thoracique, douleur des membres inférieurs, hémoptysie et insuffisance cardiaque chronique.
Huit algorithmes d’AA ont été évalués (ex. régression logistique, forêt aléatoire [RF]) avec validation croisée quintuple. Les performances ont été mesurées par l’aire sous la courbe ROC (AUC).
Résultats
Le modèle RF a obtenu les meilleures performances :
- Set de test : AUC = 0,813 (IC95% : 0,729–0,880), surpassant le score de Wells combiné aux D-dimères (AUC = 0,709 ; p=0,030) et égalant l’algorithme de YEARS (AUC = 0,719).
- Validation interne : AUC = 0,726 (IC95% : 0,652–0,801).
La valeur prédictive négative (VPN) du RF était de 0,953, indiquant une capacité élevée à exclure l’EPA.
Discussion
Le modèle RF, en exploitant des interactions complexes entre variables, surpasse les scores cliniques traditionnels. Sa VPN élevée pourrait réduire le recours inutile à l’angioscanner. Les limitations incluent le caractère rétrospectif et monocentrique, ainsi que l’absence de comparaison directe avec d’autres modèles d’AA.
Les outils traditionnels (score de Wells, algorithme de YEARS) présentent des limites d’applicabilité (ex. patients hospitalisés, cas graves). Le modèle RF offre une approche objective et automatisée, alignée avec les travaux antérieurs (ex. Banerjee et al., AUC=0,90 ; Hou et al., AUC=0,799).
Conclusion
Le modèle RF, basé sur des données cliniques accessibles, améliore le diagnostic précoce de l’EPA et pourrait optimiser la prise en charge. Des études multicentriques et l’intégration de l’imagerie sont nécessaires pour renforcer sa validité.
doi.org/10.1097/CM9.0000000000002837