Caractéristiques cliniques et marqueurs de laboratoire basés sur l’apprentissage automatique et profond pour la prédiction de la sarcopénie

Caractéristiques cliniques et marqueurs de laboratoire basés sur l’apprentissage automatique et profond pour la prédiction de la sarcopénie

Résumé
La sarcopénie, trouble musculaire squelettique lié à l’âge, se caractérise par une perte progressive de masse, de force et de fonction musculaires. Elle constitue un enjeu majeur de santé publique, en particulier chez les populations vieillissantes, en raison de son association avec des complications telles que la fragilité, les chutes, le handicap et une mortalité accrue. Les méthodes diagnostiques traditionnelles (IRM, scanner, DXA, BIA) présentent des limites en termes de coût, d’exposition aux rayonnements ou de spécificité populationnelle. Dans cette étude, nous proposons un modèle d’apprentissage automatique pour diagnostiquer la sarcopénie à partir de caractéristiques cliniques et de biomarqueurs sériques accessibles. Quatre modèles (SVM, Forêt aléatoire, XGB et W&D) ont été évalués sur des cohortes chinoises (WCHAT et XMAT). Le modèle Wide and Deep (W&D), combinant mémoire linéaire et généralisation des réseaux neuronaux profonds, a démontré les meilleures performances (AUC = 0,970 en validation externe). Les caractéristiques sélectionnées incluent l’âge, des paramètres anthropométriques (circonférence du mollet, épaisseur du pli cutané tricipital) et des indicateurs biologiques (ratio AST/ALT). Ce modèle offre une alternative économique et précise au diagnostic conventionnel, adaptée aux structures de soins primaires.

Mots-clés : Sarcopénie, Apprentissage automatique, Modèle Wide and Deep, Diagnostic, Vieillissement

Introduction
La sarcopénie, reconnue comme maladie liée à l’âge par l’OMS, représente un défi clinique croissant. Son diagnostic précoce est entravé par le coût et les limites techniques des outils actuels. Les avancées en intelligence artificielle offrent des perspectives novatrices pour l’identification de biomarqueurs accessibles. Cette étude vise à développer un modèle prédictif basé sur des données cliniques et biologiques standardisées, en exploitant les forces combinées des modèles linéaires et des réseaux neuronaux profonds.

Méthodes
Cohortes et données : L’étude a utilisé les données de 4 057 participants de la cohorte WCHAT (772 sarcopéniques) pour l’entraînement et 553 participants de XMAT (149 sarcopéniques) pour la validation externe. Les données incluaient 109 caractéristiques : informations démographiques, évaluations musculaires, marqueurs sériques et comorbidités.

Sélection des caractéristiques : Les variables continues (test U de Mann-Whitney) et catégorielles (test du χ²) avec p < 0,05 ont été retenues, suivies d’une réduction de dimension par ACP. Douze caractéristiques ont été sélectionnées : âge, poids, épaisseur du pli cutané tricipital (TST), circonférence du mollet (CC), circonférence brachiale (MAC), ratio AST/ALT, démangeaisons cutanées (SBITCS), syncope (SBAPSY), hospitalisation récente (MCANEE), consultations médicales (MCAILL), réduction d’activité physique (LFPHY) et tâches ménagères modérées (LFIACT).

Modèles d’apprentissage : Quatre modèles ont été comparés :

  1. SVM (Machine à vecteurs de support)
  2. Forêt aléatoire (RF)
  3. XGBoost (XGB)
  4. Wide and Deep (W&D) : Combinaison d’un modèle linéaire (« wide ») et d’un réseau neuronal à trois couches cachées (« deep »), optimisé via une fonction de perte logistique.

Validation : Performances évaluées par l’AUC et l’exactitude (ACC), avec validation croisée stratifiée à cinq plis.

Résultats
Le modèle W&D a obtenu les meilleurs résultats :

  • Entraînement : AUC = 0,916 ± 0,006 ; ACC = 0,882 ± 0,006
  • Test : AUC = 0,881 ; ACC = 0,862
  • Validation externe : AUC = 0,970 ; ACC = 0,911

Les autres modèles ont montré des performances inférieures (SVM : AUC = 0,766 ; XGB : AUC = 0,722 en validation externe). Les paramètres anthropométriques (CC, MAC) et le ratio AST/ALT ont été les contributeurs principaux à la prédiction.

Discussion
Le modèle W&D surpasse les approches conventionnelles en intégrant la capacité de mémorisation des interactions caractéristiques (modèle wide) et la généralisation des relations non linéaires (modèle deep). L’utilisation de marqueurs accessibles (ex. : circonférence du mollet) renforce son applicabilité en milieux précaires. Le ratio AST/ALT, corrélé à la fragilité, souligne le lien entre dysfonctionnement hépatique et sarcopénie. La réduction d’activité physique (LFPHY) reflète la dégradation fonctionnelle, alignée avec les critères diagnostiques EWGSOP.

Limites : Bien que validé sur deux cohortes, une généralisation à d’autres populations nécessite des études multicentriques. La sensibilité du modèle, bien qu’élevée, pourrait être améliorée par l’ajout de biomarqueurs inflammatoires (ex. : IL-6).

Conclusion
Cette étude valide le potentiel des modèles hybrides d’IA pour le diagnostic de la sarcopénie, combinant simplicité des données cliniques et puissance prédictive. Le modèle W&D, particulièrement adapté aux contextes gérontologiques et aux ressources limitées, représente une avancée vers une prise en charge personnalisée et précoce des populations vieillissantes. L’intégration de ces outils dans les systèmes de santé primaire pourrait réduire les coûts associés aux complications de la sarcopénie.

Référence
doi : 10.1097/CM9.0000000000002633

Laisser un commentaire 0

Your email address will not be published. Required fields are marked *