Apprendimento automatico predice la schizofrenia analizzando nei giovani la densità semantica

Il metodo di apprendimento automatico nel linguaggio delle persone ha scoperto nell’uso frequente di parole associate ad allucinazione uditiva, un indizio nascosto che predice la successiva comparsa della psicosi. La rivista Schizophrenia ha pubblicato i risultati degli scienziati dell’Emory University e dell’Harvard University.
I ricercatori hanno anche sviluppato un nuovo metodo di apprendimento automatico per quantificare con più precisione la ricchezza semantica del linguaggio conversazionale delle persone, un indicatore noto per le psicosi.
I loro risultati mostrano che l’analisi automatizzata delle due variabili linguistiche – l’uso più frequente di parole associate a voci e suoni e il parlare con bassa densità semantica, o vaghezza – può prevedere con una precisione del 93% se una persona a rischio svilupperà in seguito una psicosi.
E’ emerso che anche i medici esperti non avevano notato come le persone a rischio di psicosi, oltre la media usano più parole associate ad allucinazione uditiva, anche se una percezione uditiva anormale è un sintomo preclinico.
Neguine Rezaii, prima autrice dello studio ha iniziato a lavorare sulla relazione mentre era impegnata al Dipartimento di Psichiatria e scienze comportamentali presso l’Emory Scuola di Medicina, ora lavora al Dipartimento di Neurologia dell’Harvard Medical School of Neurology, ha detto:
«La tecnica automatizzata che abbiamo sviluppato è uno strumento davvero sensibile, per i sintomi di psicosi è come un microscopio per rilevare questi modelli nascosti».
Phillip Wolff, professore di psicologia presso l’Emory Scuola di Medicina, del team di ricerca ha aggiunto:
«Era noto in precedenza che le impercettibili caratteristiche delle future psicosi sono presenti nel linguaggio della gente, abbiamo usato l’apprendimento automatico per scoprire effettivamente i dettagli nascosti di quelle caratteristiche.
Il nostro laboratorio si concentra sulla semantica linguistica e sull’apprendimento automatico per prevedere il processo decisionale e la salute mentale».
Elaine Walker, professoressa di psicologia e neuroscienze dell’Emory Scuola di Medicina, studia come si sviluppano la schizofrenia e altri disturbi psicotici, ha detto:
«La nostra scoperta aggiunge prove che dimostrano il potenziale per l’utilizzo dell’apprendimento automatico per identificare anomalie linguistiche associate a malattie mentali».

Insorgenza della schizofrenia
L’insorgenza della schizofrenia e di altri disturbi psicotici accade in genere nei primi anni 20, a partire dall’età di 17 anni con segni di avvertimento noto come sindrome prodromica (è caratterizzata dall’espressione di anomalie subcliniche nel pensiero, nella percezione e nella comunicazione).
Circa il 25-30 per cento dei giovani che soddisfano i criteri per una sindrome prodromica svilupperà la schizofrenia o un altro disturbo psicotico. I medici addestrati utilizzando colloqui strutturati e test cognitivi in soggetti con sindrome prodromica, possono prevedere la psicosi con circa l’80% di precisione. La ricerca ad apprendimento automatico è uno dei tanti sforzi in corso per semplificare i metodi diagnostici, identificare nuove variabili e migliorare l’accuratezza delle previsioni.

Al momento non esiste una cura per le psicosi
Elaine Walker spiega:
«Se siamo in grado di identificare gli individui che sono a rischio e utilizzare interventi preventivi, potremmo essere in grado di invertire i deficit.
Ci sono buoni riscontri, dimostrano che trattamenti come la terapia cognitivo-comportamentale può ritardare, forse anche ridurre l’insorgenza di psicosi».
I ricercatori per la prima volta hanno utilizzato l’apprendimento automatico per stabilire “norme” per il linguaggio conversazionale. Hanno inserito in un programma software per computer le conversazioni online di 30.000 utenti di Reddit, una piattaforma di social media, dove le persone hanno discussioni informali su una serie di argomenti.
Il programma software, noto come Word2Vec, utilizza un algoritmo per cambiare le singole parole in vettori, assegnando a ciascuno una posizione in uno spazio semantico in base al suo significato: quelli con significati simili sono posti più vicini tra loro rispetto a quelli con significati molto diversi.
Il laboratorio del team di Phillip Wolff, ha anche sviluppato un programma informatico per eseguire ciò che i ricercatori hanno definito “disimballaggio vettoriale”, o analisi della densità semantica dell’uso delle parole. Il lavoro precedente ha misurato la coerenza semantica tra le frasi. Il disimballaggio vettoriale ha permesso ai ricercatori di quantificare le informazioni che erano contenute in ogni frase.
I ricercatori dopo aver generato una linea di base di dati “normali”, hanno applicato a 40 partecipanti le stesse tecniche di colloqui diagnostici condotti da medici facenti, parte dello studio multisito del North American Prodrome Longitudinal Study (NAPLS), finanziato dal National Institutes of Health.
Il NAPLS è focalizzato sui giovani ad alto rischio clinico per le psicosi. Elaine Walker è la principale ricercatrice del NAPLS presso l’Emory Scuola di Medicina, una delle nove università coinvolte nel progetto di 14 anni.
Le analisi automatizzate dei campioni dei partecipanti sono state poi confrontate con il normale campione di riferimento e i dati longitudinali sulla conversione alla psicosi dei partecipanti.
Lo studio longitudinale (o indagine longitudinale), è un progetto di ricerca che comporta osservazioni ripetute delle stesse variabili (ad esempio, persone) su periodi brevi o lunghi (ad esempio, utilizza dati longitudinali).
I risultati hanno mostrato che un uso più elevato del normale delle parole legate ad allucinazione uditiva, combinato con un più alto tasso di utilizzo di parole con significato simile, indica che la psicosi probabilmente è all’orizzonte.
I punti di forza dello studio includono la semplicità dell’utilizzo di due sole variabili, entrambe con una solida base teorica: la replica dei risultati in un set di “dati holdout” e l’elevata precisione delle sue previsioni, superiore al 90%.
Il sottoinsieme di “dati holdout” fornisce una stima finale delle prestazioni del modello di apprendimento automatico dopo che è stato addestrato e convalidato. I set di “holdout” non dovrebbero mai essere usati per prendere decisioni su quali algoritmi usare o per migliorare o ottimizzare gli algoritmi.
Neguine Rezaii ha detto:
«Nel campo clinico, spesso manca la precisione, abbiamo bisogno di metodi più quantificati e oggettivi per misurare variabili impercettibili, come quelle nascoste nell’uso della lingua».
Neguine Rezaii e Phillip Wolff, ora stanno raccogliendo serie di dati più ampi, testando l’applicazione dei loro metodi su una varietà di malattie neuropsichiatriche, compresa la demenza.
Phillip Wolff in conclusione ha detto:
«Questa ricerca è interessante non solo per il suo potenziale di rivelare di più sulla malattia mentale, ma anche per capire come funziona la mente, come mette insieme le idee.
La tecnologia di apprendimento automatico avanza rapidamente, ci sta dando gli strumenti per estrarre dati dalla mente umana».

,
Pino Silvestri

About Pino Silvestri

Pino Silvestri, blogger per diletto, fondatore, autore di Virtualblognews, presente su Facebook e Twitter.
View all posts by Pino Silvestri →