Les inégalités d’échantillonnage affectent la généralisation de la neuroimagerie
MaisonMaison > Nouvelles > Les inégalités d’échantillonnage affectent la généralisation de la neuroimagerie

Les inégalités d’échantillonnage affectent la généralisation de la neuroimagerie

Jun 03, 2024

BMC Medicine volume 21, Numéro d'article : 241 (2023) Citer cet article

1163 Accès

1 Citation

3 Altmétrique

Détails des métriques

Le développement de modèles d’apprentissage automatique pour faciliter le diagnostic des troubles mentaux est reconnu comme une avancée majeure dans le domaine de la psychiatrie. Cependant, la pratique clinique de tels modèles reste un défi, la faible généralisabilité constituant une limitation majeure.

Ici, nous avons mené une méta-recherche pré-enregistrée sur des modèles basés sur la neuroimagerie dans la littérature psychiatrique, examinant quantitativement les problèmes d'échantillonnage mondiaux et régionaux au cours des dernières décennies, d'un point de vue relativement sous-exploré. Au total, 476 études (n = 118 137) ont été incluses dans l'évaluation actuelle. Sur la base de ces résultats, nous avons construit un système complet d'évaluation 5 étoiles pour évaluer quantitativement la qualité des modèles d'apprentissage automatique existants pour les diagnostics psychiatriques.

Une inégalité d'échantillonnage globale dans ces modèles a été révélée quantitativement (coefficient de Gini d'échantillonnage (G) = 0,81, p < 0,01), variant selon les différents pays (régions) (par exemple, Chine, G = 0,47 ; États-Unis, G = 0,58 ; Allemagne). , G = 0,78 ; Royaume-Uni, G = 0,87). De plus, la gravité de cette inégalité d'échantillonnage était prédite de manière significative par les niveaux économiques nationaux (β = − 2,75, p < 0,001, R2adj = 0,40 ; r = − 0,84, IC à 95 % : − 0,41 à − 0,97), et était plausiblement prévisible pour les performances du modèle, avec une inégalité d'échantillonnage plus élevée pour signaler une précision de classification plus élevée. Des analyses plus approfondies ont montré que le manque de tests indépendants (84,24 % des modèles, IC à 95 % : 81,0 à 87,5 %), une validation croisée inappropriée (51,68 % des modèles, IC à 95 % : 47,2 à 56,2 %) et une mauvaise transparence technique (87,8 Le pourcentage de modèles, IC à 95 % : 84,9 à 90,8 %)/la disponibilité (80,88 % des modèles, IC à 95 % : 77,3 à 84,4 %) prédominent dans les classificateurs de diagnostic actuels malgré les améliorations au fil du temps. En ce qui concerne ces observations, les performances du modèle ont été constatées diminuées dans les études avec des validations indépendantes d'échantillonnage transnational (toutes p < 0,001, BF10 > 15). À la lumière de cela, nous avons proposé une liste de contrôle d'évaluation quantitative spécialement conçue, qui démontrait que les notes globales de ces modèles augmentaient selon l'année de publication mais étaient négativement associées aux performances du modèle.

Ensemble, l’amélioration de l’égalité économique d’échantillonnage et donc de la qualité des modèles d’apprentissage automatique peuvent constituer une facette cruciale pour traduire de manière plausible les classificateurs diagnostiques basés sur la neuroimagerie dans la pratique clinique.

Rapports d'examen par les pairs

Les modèles d'apprentissage automatique (ML) ont été largement utilisés pour classer les patients atteints de maladie mentale afin d'aider à la prise de décision clinique (1, 2). En créant des modèles d'apprentissage automatique formés à partir de fonctionnalités basées sur la neuroimagerie, la décision diagnostique pourrait être plus précise et plus fiable à l'aide de ces biomarqueurs objectifs et de grande dimension (3, 4). De plus, étant donné la nature multivariée des caractéristiques du cerveau, les techniques d'apprentissage automatique pourraient capturer l'ensemble du schéma neuronal à travers des voxels dépendants d'un volume élevé pour révéler les signatures physiopathologiques de ces troubles, tandis que la prédiction individualisée des modèles d'apprentissage automatique dans les modèles ML basés sur la neuroimagerie facilite également répondre aux besoins croissants de la psychiatrie de précision [5, 6]. Malgré les efforts considérables consacrés à cette fin, la traduction de la classification par apprentissage automatique pour les recommandations de diagnostic et de traitement dans la pratique clinique reste un défi [7]. Ceci est en partie dû à la faible généralisabilité de ces classificateurs basés sur la neuroimagerie, qui sont souvent optimisés au sein d'un échantillon spécifique pour entraîner l'échec de la généralisation pour diagnostiquer des patients invisibles dans de nouveaux échantillons (8,9,10). Bien que ces classificateurs puissent être formés pour atteindre une précision élevée dans une cohorte spécifique, ils ne sont pas représentatifs d'une population plus générale dans les centres médicaux, les régions géographiques, les statuts socio-économiques et les groupes ethniques (11, 12). De plus, les préoccupations persistantes quant à la généralisabilité impliquent des biais d’échantillonnage potentiels malgré l’augmentation substantielle de la taille des données au cours des dernières décennies [13].

 3 for strong evidence. To examine the non-linear associations of these variables of interest, we have built the generalized additive model (GAM) with natural shape-free spline functions by R package (“mgcv”). To obviate overfitting, the shape-free splines (i.e., smooth function) were used in these models. Finally, metrics of model performance (i.e., classification accuracy) for each study were precision-weighted rather than the original ones as reported./p>