proteine ripetutamente Le proteine funzionali, che hanno un’omologia limitata con le proteine naturali, sono state progettate utilizzando grandi modelli di apprendimento. Ma questa tecnologia è costosa e richiede tempo. Di recente, una piccola startup in California ha utilizzato un’intelligenza artificiale basata su un modello di apprendimento basato sulla generazione di testo come ChatGPT per progettare nuove proteine funzionali antibatteriche. Questo nuovo percorso consentirà di sviluppare nuovi farmaci in tempi molto più brevi.
L’evoluzione diretta ha dimostrato di essere notevolmente efficace nel trovare varianti di proteine note con proprietà migliorate. In effetti, ricorda che l’evoluzione diretta è un metodo utilizzato nell’ingegneria delle proteine che imita un processo selezione naturale Per “dirigere” lo sviluppo di proteine per uno scopo specifico, come lo sviluppo di trattamenti a lungo termine per malattie non soggette a restrizioni di brevetto, o enzimi in grado di crollare plastica Non riciclabile, ad es. Questa tecnologia ha vinto il premio Nobel per la chimica nel 2018.
Tuttavia, il design proteina che non sono identici a quelli che si trovano in natura sono molto difficili. Fino ad ora, il campo si è affidato a due metodi tradizionali: ricerche costose e dispendiose in termini di tempo per le proteine presenti in natura, o il tentativo di apportare piccole modifiche a una proteina esistente nella speranza di ottenere il risultato desiderato.
L’intelligenza artificiale potrebbe fornire un modo intelligente per assumere il duro lavoro di progettazione di questa proteina. Le proteine non sono in alcun modo più o meno dell’ordine degli amminoacidi legati da legami peptidici, questi amminoacidi sono come parole coordinate tra loro in una frase. Chiacchierare Si è già dimostrato efficace nel superare con successo gli esami per Giusto et al risparmioper generare testo continuamente.
Di recente, sulla base di questo principio, la startup Rich di Berkeley (California), in collaborazione con l’Università della California di San Francisco (UCSF), ha utilizzato modelli generativi profondi per “insegnare il linguaggio della biologia” all’intelligenza artificiale, per progettare nuove proteine funzionali . I modelli avanzati vengono addestrati su dati su larga scala. Il loro lavoro è stato pubblicato sulla rivista Biotecnologie naturali.
ProGen, una rivoluzione nell’ingegneria biologica
Come i modelli del linguaggio testuale, i modelli professionali vengono addestrati su dati su larga scala, ma invece di aggettivi e sostantivi imparano il “linguaggio del codice genetico”.
Il ricco fondatore Ali Madani spiega in a rapporto : « Mentre le aziende stanno sperimentando nuove entusiasmanti biotecnologie come l’editing del genoma CRISPR Riallocando ciò che la natura ci ha dato, stiamo facendo qualcosa di diverso. Utilizziamo l’intelligenza artificiale e modelli di linguaggio di grandi dimensioni come quello che consente a ChatGPT di apprendere il linguaggio di base della biologia e progettare nuove proteine che hanno il potenziale per curare le malattie. ».
Per creare il loro modello, gli scienziati hanno inserito le sequenze di amminoacidi di 280 milioni di diverse proteine di tutti i tipi in un modello di apprendimento automatico e gli hanno permesso di integrare le informazioni per alcune settimane. Successivamente, hanno perfezionato il modello dotandolo di 56.000 sequenze di cinque famiglie di lisozimi, insieme a informazioni contestuali su queste proteine.
Il modello ha generato rapidamente un milione di sequenze e il team di ricerca ne ha selezionate 100 per i test in base alla loro somiglianza con le sequenze proteiche naturali, nonché alle “basi” e ai “segnali” naturali delle sequenze di amminoacidi essenziali delle proteine generate dall’intelligenza artificiale.
Da questo primo lotto di 100 proteine, il team ha prodotto cinque proteine sintetiche da testare nelle cellule e ha confrontato la loro attività con un enzima presente negli albumi, noto come lisozima dell’albume di pollo (HEWL). Lisozimi simili si trovano nelle lacrime umane, nella saliva e nel latte, dove combattono batteri e funghi.
proteine funzionali
Nello specifico, due enzimi sintetici sono stati in grado di abbattere le pareti delle cellule batteriche con un’attività simile a HEWL, ma le loro sequenze erano identiche solo al 18%. Le due sequenze erano identiche al 90% e al 70%, rispettivamente, a qualsiasi proteina nota.
Una mutazione in una proteina normale può impedirne il funzionamento. Ma il team ha scoperto che gli enzimi generati dall’intelligenza artificiale hanno mostrato attività nonostante solo il 31,4% di somiglianza tra la loro sequenza e quella di una proteina naturale nota.
Per non parlare del fatto che l’intelligenza artificiale è stata in grado di apprendere come si formano gli enzimi semplicemente studiando i dati grezzi della sequenza. Misurate con la cristallografia a raggi X, le strutture atomiche delle proteine sintetiche apparivano “corrette”, sebbene le sequenze fossero diverse da qualsiasi cosa conosciuta.
Uso di ProGen per la produzione di farmaci
Dovresti sapere che Salesforce Research ha sviluppato ProGen nel 2020, basato su un tipo di programmazione in linguaggio naturale che i suoi ricercatori hanno inizialmente sviluppato per generare testo in inglese. Sapevano dal loro lavoro precedente che un sistema di intelligenza artificiale può autoapprendere la grammatica e il significato delle parole, così come altre regole di base che rendono la scrittura ben formata.
Nikhil Naik, Ph.D., direttore della ricerca sull’intelligenza artificiale presso Salesforce Research e autore principale dello studio, afferma in una dichiarazione rapporto Dall’UCSF: Quando si addestrano modelli basati su sequenza con molti dati, è davvero potente per l’apprendimento della struttura e delle regole. Imparano parole che possono coesistere ».
Per le proteine, le opzioni di progettazione sono quasi illimitate. I lisozimi sono piccoli come le proteine, contenenti fino a 300 aminoacidi. Mentre con solo 20 possibili combinazioni di amminoacidi, ci sono 20.300 combinazioni possibili, per i lisozimi il numero è schiacciante.
Per gli autori, date le infinite possibilità, è notevole che il modello possa generare enzimi funzionanti con tanta facilità. Ali Madani conclude: Questo è un nuovo strumento versatile a disposizione degli ingegneri proteici e non vediamo l’ora di vedere applicazioni terapeutiche. ».
Fonte : Biotecnologie naturali
“Un drogato di zombi amante degli hipster. Aspirante risolutore di problemi. Appassionato di viaggi incurabile. Appassionato di social media. Introverso.”