Efficaci proteine che uccidono i batteri, create da zero con l’intelligenza artificiale

L’intelligenza artificiale ha progettato proteine antimicrobiche che sono state poi testate nella vita reale e hanno dimostrato di funzionare. Lo stesso procedimento potrebbe essere utilizzato per creare nuovi farmaci.
Le proteine sono costituite da catene di aminoacidi, la sequenza di questi acidi determina la forma e la funzione della proteina.
Ali Madani fondatore di Profluent Bio una start-up di biotecnologie in California, ex ricercatore presso Salesforce Research, insieme ai suoi colleghi hanno utilizzato l’intelligenza artificiale per progettare milioni di nuove proteine, creando poi un piccolo campione per verificarne il funzionamento.
Salesforce Research ha sviluppato il programma Intelligenza Artificiale chiamato ProGen, utilizza la previsione del token successivo per assemblare sequenze di aminoacidi in proteine artificiali. I ricercatori hanno affermato che la nuova tecnologia potrebbe diventare più potente dell’evoluzione diretta, una tecnologia di progettazione proteica vincitrice del premio Nobel, e darà energia al campo dell’ingegneria proteica vecchio di 50 anni, accelerando lo sviluppo di nuove proteine che possono essere utilizzate per quasi tutto dalla terapeutica alla plastica degradante. ProGen funziona in modo simile a ChatGpt chatbot addestrato a scrivere testi su qualsiasi argomento.
James Fraser professore di bioingegneria e scienze terapeutiche presso la Scuola di Farmacia dell’Università della California di San Francisco, autore dello studio pubblicato nella rivista Nature Biotechnology, ha affermato:
«Il modello linguistico di ProGen sta imparando aspetti dell’evoluzione, ma è diverso dal normale processo evolutivo, ora abbiamo la possibilità di ottimizzare la generazione di queste proprietà per effetti specifici, ad esempio, un enzima che è incredibilmente termostabile o ama gli ambienti acidi o non interagisce con altre proteine».
I ricercatori per creare il modello, hanno semplicemente inserito le sequenze di aminoacidi di 280 milioni di diverse proteine di tutti i tipi nel modello di apprendimento automatico e hanno lasciato che digerisse le informazioni per un paio di settimane, quindi, hanno messo a punto il modello innescandolo con 56.000 sequenze di cinque famiglie di lisozimi, insieme ad alcune informazioni contestuali su queste proteine.
Il modello ha generato rapidamente un milione di sequenze, il team di ricerca ne ha selezionate 100 da testare in base a quanto assomigliavano alle sequenze di proteine naturali e a quanto fossero naturalistiche la “grammatica” e la “semantica” dell’amminoacido alla base delle proteine progettate con l’intelligenza artificiale.
Il team di ricercatori da questo primo lotto di 100 proteine, che sono state vagliate in vitro da Tierra Biosciences, ha prodotto cinque proteine artificiali da testare nelle cellule e ha confrontato la loro attività con un enzima presente nel bianco delle uova di gallina, noto come lisozima dell’albume di gallina. È un enzima disponibile naturalmente nel corpo umano, è presente in lacrime, latte, saliva e muco e, in grandi quantità, anche nell’albume d’uovo di gallina. Svolge una naturale attività antibatterica, soprattutto nei confronti dei gram-positivi (batteri e funghi).
I ricercatori hanno detto che due degli enzimi artificiali sono stati in grado di abbattere le pareti cellulari dei batteri con un’attività paragonabile a quella del lisozima dell’albume di gallina, ma le loro sequenze erano identiche tra loro solo per il 18% circa. Le due sequenze erano circa il 90% e il 70% identiche a qualsiasi proteina nota, solo una mutazione in una proteina naturale può farla smettere di funzionare, ma in un diverso ciclo di screening.
Il team di ricercatori ha scoperto che gli enzimi generati dall’intelligenza artificiale mostravano attività anche quando solo il 31,4% della loro sequenza assomigliava a qualsiasi proteina naturale conosciuta.
L’intelligenza artificiale è stata persino in grado di apprendere come dovrebbero essere modellati gli enzimi, semplicemente studiando i dati grezzi della sequenza. Misurate con la cristallografia a raggi X, le strutture atomiche delle proteine artificiali sembravano esattamente come dovrebbero, anche se le sequenze non erano mai state viste prima.
Salesforce Research nel 2020 ha sviluppato ProGen sulla base di una sorta di programmazione in linguaggio naturale, che i loro ricercatori avevano originariamente sviluppato per generare testo in lingua inglese. Sapevano dal loro lavoro precedente che il sistema di intelligenza artificiale poteva insegnare da solo la grammatica e il significato delle parole, insieme ad altre regole sottostanti che rendono la scrittura ben composta.
Nikhil Naik, direttore della ricerca sull’intelligenza artificiale presso Salesforce Research, ha fatto parte del team di ricerca, ha affermato:
«Quando si addestrano modelli basati su sequenze con molti dati, sono davvero potenti nell’apprendimento della struttura e delle regole, imparano quali parole possono coesistere e anche la composizionalità».
I ricercatori hanno detto che con le proteine, le scelte progettuali erano quasi illimitate. I lisozimi sono piccoli come le proteine, con un massimo di circa 300 amminoacidi, ma con 20 amminoacidi possibili, esiste un numero enorme (20 300) di possibili combinazioni, praticamente è più grande che prendere tutti gli umani vissuti nel tempo, moltiplicati per il numero di granelli di sabbia sulla Terra, moltiplicati per il numero di atomi nell’universo. Viste le illimitate possibilità, è straordinario che il modello possa generare così facilmente enzimi funzionanti.
Ali Madani in conclusione ha detto:
«La capacità di generare proteine funzionali da zero e fuori dagli schemi, dimostra che stiamo entrando in una nuova era della progettazione delle proteine, questo è un nuovo strumento versatile a disposizione degli ingegneri proteici, non vediamo l’ora di vedere le applicazioni terapeutiche».

Intelligenza artificiale proteine antimicrobiche