L’intelligenza artificiale addestrata a leggere articoli scientifici potrebbe prevedere future scoperte

Alan Turing famoso matematico, decodificatore e scienziato informatico, quasi 70 anni fa chiese: “Le macchine possono pensare?”. Oggi, alcuni esperti non hanno dubbi sul fatto che l’intelligenza artificiale presto sarà in grado di sviluppare il tipo d’intelligenza generale che l’uomo possiede, ma altri sostengono che le macchine non saranno mai all’altezza.
L’intelligenza artificiale anche se può già superare gli umani in certi compiti – proprio come le calcolatrici – non è ancora in grado di misurarsi con la creatività dell’uomo. L’ingegno umano, che a volte è guidato dalla passione e dall’intuizione piuttosto che dalla logica e dall’evidenza, in definitiva ci ha permesso di fare scoperte spettacolari che vanno dai vaccini alle particelle fondamentali.
L’intelligenza artificiale non sarà mai in grado di competere? Beh, a quanto pare potrebbe: recentemente un articolo pubblicato su Nature riporta che l’intelligenza artificiale ora è riuscita a prevedere le future scoperte scientifiche semplicemente estrapolando dati significativi dalle pubblicazioni di ricerca.
Il linguaggio ha una profonda connessione con il pensiero, ha plasmato la società umana, le relazioni e, in ultima analisi, l’intelligenza, per questo non sorprende che il Santo Graal della ricerca dell’intelligenza artificiale sia la piena comprensione del linguaggio umano in tutte le sue sfumature. L’elaborazione del linguaggio naturale, detta anche NLP (dall’inglese Natural Language Processing, elaborazione lingua naturale), che fa parte di un quadro più ampio chiamato apprendimento automatico, mira a valutare, estrapolare e considerare le informazioni dai dati testuali. I bambini imparano interagendo con il mondo circostante attraverso prove ed errori. Imparare come andare in bicicletta spesso comporta alcuni dossi e cadute, in altre parole, commettiamo errori e impariamo da loro.
È proprio così che funziona l’apprendimento automatico, talvolta con un extra input “educativo” (apprendimento automatico controllato), ad esempio, un’intelligenza artificiale può imparare a riconoscere gli oggetti nelle immagini costruendo un’immagine di un oggetto da molti singoli esempi. L’essere umano in questo caso deve mostrare immagini contenenti l’oggetto o meno. Il computer fa quindi una supposizione e regola il suo modello statistico in base all’accuratezza della supposizione, come stabilito dall’essere umano. Tuttavia, possiamo anche lasciare che il programma del computer faccia da solo tutto il rilevante apprendimento (apprendimento automatico non supervisionato). L’intelligenza artificiale in questo caso inizia automaticamente ad essere in grado di rilevare i modelli nei dati. Il programma di computer in entrambi, i casi, deve trovare una soluzione valutando quanto è sbagliato, e poi cercare di regolarlo per minimizzare tale errore.
Supponiamo di voler comprendere alcune proprietà relative ad un materiale specifico. Il passo più ovvio è quello di cercare informazioni da libri, pagine web e qualsiasi appropriata altra risorsa. Tuttavia, questo richiede tempo, in quanto può comportare ore di ricerca sul web, lettura di articoli e pubblicazioni specializzate. Natural Language Processing (NLP), può in ogni modo aiutarci, attraverso metodi e tecniche avanzate, i programmi per computer da grandi insiemi di dati testuali, possono identificare concetti, relazioni reciproche, argomenti generali e proprietà specifiche.
L’intelligenza artificiale evidenziata nel nuovo studio ha imparato a recuperare informazioni dalla letteratura scientifica attraverso un apprendimento non supervisionato. Ciò ha notevoli implicazioni, finora, la maggior parte dei metodi automatizzati esistenti basati sul Natural Language Processing (NLP) sono supervisionati e richiedono l’input degli esseri umani, nonostante sia un miglioramento rispetto ad un metodo puramente manuale, si tratta in ogni modo di un lavoro ad alta intensità di manodopera.
I ricercatori hanno creato un sistema in grado di identificare ed estrarre le informazioni in modo accurato e indipendente, utilizzando tecniche avanzate basate sulle proprietà statistiche e geometriche dei dati per identificare nomi chimici, concetti e strutture. La base è costituita da circa 1,5 milioni di estratti di documenti scientifici sulla scienza dei materiali. Il programma dell’apprendimento automatico ha poi classificato le parole nei dati in conformità a caratteristiche specifiche come “elementi”, “energia” e “leganti”: per esempio, “calore” è stato classificato come parte di “energetica”, e “gas” come “elementi”. Ciò ha aiutato a collegare alcuni composti con tipi di magnetismo, e somiglianza con altri materiali, fornendo un’idea di come le parole fossero collegate senza la necessità dell’intervento umano.

Scoperte scientifiche
Il nuovo metodo potrebbe acquisire relazioni complesse e identificare diversi livelli di informazione, che in sostanza sarebbe impossibile da realizzare per gli esseri umani. Ha fornito intuizioni con largo anticipo rispetto a quanto gli scienziati possono prevedere al momento. Infatti, l’intelligenza artificiale potrebbe raccomandare materiali per applicazioni funzionali diversi anni prima della loro effettiva scoperta. Ci sono state cinque previsioni di questo tipo, tutte basate su documenti pubblicati prima del 2009: ad esempio, l’intelligenza artificiale è riuscita a identificare una sostanza nota come CsAgGa2Se4as come materiale termoelettrico, che gli scienziati hanno scoperto solo nel 2012.
L’intelligenza artificiale, quindi, se fosse stata in circolazione nel 2009, avrebbe potuto accelerare la scoperta, ha fatto la previsione collegando il composto con parole come “calcogenuro ” (materiale contenente “elementi di calcogeno” come zolfo o selenio), “optoelettronico” (dispositivi elettronici che generano, rilevano e controllano la luce) e “applicazioni fotovoltaiche“. Molti materiali termoelettrici condividono tali proprietà, l’intelligenza artificiale è stata rapida a dimostrarlo. Ciò suggerisce che le conoscenze latenti sulle scoperte future sono in larga misura incorporate in pubblicazioni del passato.
I sistemi d’intelligenza artificiale stanno diventando sempre più indipendenti. E non c’è nulla da temere. Ci possono aiutare enormemente a navigare attraverso l’enorme quantità di dati e informazioni, che sono continuamente create dalle attività umane. L’intelligenza artificiale nonostante le preoccupazioni legate alla privacy e alla sicurezza, sta cambiando la nostra società, ci porterà a prendere decisioni migliori, a migliorare la nostra vita quotidiana e infine a renderci più intelligenti.

Pino Silvestri

About Pino Silvestri

Pino Silvestri, blogger per diletto, fondatore, autore di Virtualblognews, presente su Facebook e Twitter.
View all posts by Pino Silvestri →