Commento
L’ecocardiografia è uno strumento chiave sia per porre il sospetto diagnostico sia per il follow-up dell’ipertensione polmonare (PH). Tuttavia, la valutazione del cuore destro resta una delle parti più impegnative dell’esame: la geometria complessa del ventricolo destro, una qualità d’immagine talvolta non ottimale e la variabilità tra operatori possono rendere meno riproducibili misure che, invece, hanno un ruolo clinico centrale. In questo scenario, un workflow completamente automatizzato basato su deep learning (DL) potrebbe rappresentare un vantaggio concreto: velocizza l’analisi, uniforma le misurazioni e può rendere più omogenea la stratificazione dei pazienti, a condizione di dimostrare un’accuratezza comparabile a una lettura di riferimento.
Contesto
Le raccomandazioni attuali per la PH utilizzano parametri ecocardiografici del cuore destro sia nella fase di sospetto sia nella valutazione di gravità e rischio. Tra questi rientrano la TRV (velocità del rigurgito tricuspidalico), la TAPSE (escursione sistolica del piano dell’anello tricuspidale), le dimensioni del ventricolo destro, l’area dell’atrio destro e la RVFAC (frazione di variazione dell’area del ventricolo destro tra diastole e sistole). Nella pratica quotidiana, però, queste misure possono risentire della qualità del segnale Doppler, della finestra acustica e dell’accuratezza nel tracciamento delle strutture. La variabilità che ne deriva diventa particolarmente rilevante quando si cerca di identificare forme lievi di PH, dove le differenze sono più sottili e quindi più facili da “perdere”.
Domanda di ricerca
Gli autori hanno voluto verificare se un sistema DL fully automated (software Us2.ai) fosse in grado di:
- fornire misurazioni ecocardiografiche del cuore destro accurate e riproducibili, confrontabili con quelle di lettori esperti;
- mantenere una buona capacità di riconoscere la PH anche in uno scenario clinicamente più complesso, come quello delle forme lievi nei pazienti inviati a cateterismo cardiaco destro (RHC).
Disegno e metodi dello studio
Lo studio è stato condotto in due fasi. Nella prima, gli autori hanno stimato bias e precisione delle misurazioni ottenute con l’IA (deep learning) tramite Us2.ai v1.4.5, utilizzando come riferimento la lettura di ecocardiografisti esperti (core laboratory). Nella seconda fase, hanno valutato se l’IA potesse discriminare forme più lievi di PH in pazienti indirizzati a RHC, selezionando un intervallo di mPAP tra 20 e 35 mmHg.
La coorte caso-controllo comprendeva 213 soggetti sani e 221 pazienti con ipertensione arteriosa polmonare. I parametri analizzati includevano TRV di picco, diametro basale del ventricolo destro, TAPSE, area dell’atrio destro e RVFAC. La coorte “referral” comprendeva 196 pazienti; in 171 di questi era disponibile un segnale di TRV di picco misurabile. Per la valutazione statistica sono state riportate misure “robuste” di bias e precisione e, per la capacità discriminativa, è stata utilizzata l’analisi ROC con calcolo della AUC.
Risultati
Nei pazienti con ipertensione arteriosa polmonare (età media 48 anni, 78% donne, mPAP 52 mmHg), le misurazioni dell’algoritmo sono risultate sovrapponibili a quelle dei lettori esperti per TRV, area dell’atrio destro e TAPSE, senza evidenza di differenze significative. In generale, la precisione è rimasta buona per la maggior parte dei parametri, mentre la RVFAC si è confermata la misura più critica, verosimilmente perché dipende da segmentazioni e calcoli più complessi.
Dal punto di vista diagnostico, nella coorte caso-controllo la TRV di picco ha mostrato un’eccellente capacità di distinguere sani e PAH, con AUC 0,99 per la lettura degli esperti e 0,98 per il DL. Nel contesto della coorte referral, l’accuratezza era inferiore ma comunque buona: l’AUC per l’identificazione della PH è stata 0,79 con lettura degli ecocardiografisti e 0,75 con DL.
Interpretazione
Nel complesso, questo studio suggerisce che un workflow DL completamente automatizzato può già oggi essere affidabile per i parametri ecocardiografici più rilevanti nelle linee guida (TRV, TAPSE, area dell’atrio destro e misure dimensionali del ventricolo destro), offrendo un beneficio pratico in termini di standardizzazione, riduzione della variabilità e potenziale risparmio di tempo. Allo stesso tempo, è necessaria prudenza nell’estendere questi risultati: lo studio nasce in un contesto altamente specializzato e fattori tecnici (tipo di apparecchiatura, qualità delle immagini, versione del software) possono influenzare le prestazioni. Per questo, prima di considerare l’adozione su larga scala come “standard”, saranno importanti ulteriori validazioni multicentriche e su piattaforme diverse.