Inteligenţa artificială a creat proteine care „nu se găsesc în natură” Modelul ESM3 poate „scrie” proteine noi de la zero, deschizând noi posibilități pentru biologia sintetică.

La fel cum celebrul ChatGPT generează text prin prezicerea cuvântului care urmează cel mai probabil într-o secvență, un nou model de inteligență artificială (IA) poate scrie de la zero noi proteine care nu apar în mod natural.

Inteligenţa artificială a creat proteine care „nu se găsesc în natură”

Oamenii de știință au folosit noul model, ESM3, pentru a crea o nouă proteină fluorescentă care împărtășește doar 58% din secvența sa cu proteinele fluorescente naturale, au afirmat aceștia într-un studiu publicat la 2 iulie 2024 în baza de date preprint bioRxiv. Reprezentanții EvolutionaryScale, o companie formată din foști cercetători Meta, au prezentat, de asemenea, detalii într-o declaraţie recentă.[sursa]

Inteligenţa artificială a creat proteine
Inteligenţa artificială a creat proteine care „nu se găsesc în natură”

Echipa de cercetare a lansat o versiune restrânsă a modelului sub o licență necomercială și va pune versiunea mare a modelului la dispoziția cercetătorilor din sectorul comercial. Potrivit EvolutionaryScale, tehnologia ar putea fi utilă în domenii care variază de la descoperirea de medicamente la proiectarea de noi substanțe chimice pentru degradarea plasticului.

ESM3 este un model lingvistic mare (LLM – Large Language Model) similar cu GPT-4 de la OpenAI, care alimentează chatbotul ChatGPT, iar oamenii de știință și-au antrenat cea mai mare versiune pe 2,78 miliarde de proteine. Pentru fiecare proteină, cercetătorii au extras informații despre secvență (ordinea blocurilor de aminoacizi care alcătuiesc proteina), structură (forma tridimensională pliată a proteinei) și funcție (ce face proteina). Aceștia au mascat aleatoriu informații despre aceste proteine și au cerut ESM3 să prezică informațiile lipsă.[sursa]

• CITEŞTE ŞI:  Cum plănuieşte Japonia să lege Pământul de Lună şi de Marte cu trenuri spaţiale de mare viteză

Cercetătorii au lucrat în trecut la Meta şi Google

Oamenii de știința au extins acest model pornind de la cercetările pe care aceeași echipă le efectua în timp ce era încă angajată la compania Meta, care deţine Facebook şi Instagram. În anul 2022, cercetătorii au anunțat EMSFold, un precursor al ESM3 care a prezis structuri necunoscute de proteine microbiene. În acel an, DeepMind de la Alphabet (deţinătorul Google) a prezis, de asemenea, structuri proteice pentru 200 de milioane de proteine.

Oamenii de știință au subliniat ulterior că există limitări ale predicțiilor acestor modele AI și că predicțiile proteinelor trebuie verificate. Cu toate acestea, metodele pot accelera masiv căutarea structurilor proteinelor, deoarece alternativa este utilizarea razelor X pentru a cartografia structurile proteinelor una câte una, ceea ce este lent și costisitor.

Cu toate acestea, ESM3 merge dincolo de simpla predicție a proteinelor existente. Folosind informațiile obținute din 771 de miliarde de informații unice privind structura, funcția și secvența, modelul poate genera noi proteine cu funcții specifice. Acesta a fost descris drept un „moment ChatGPT pentru biologie” de către unul dintre finanțatorii EvolutionaryScale.[sursa]

În noul studiu, cercetătorii au interogat modelul pentru a genera o nouă proteină fluorescentă, un tip de proteină care captează lumina și o emite înapoi la o lungime de undă mai mare, făcând-o să strălucească într-o nouă nuanță de verde. Aceste proteine sunt importante pentru cercetătorii din domeniul biologiei, care le atașează moleculelor pe care sunt interesați să le studieze pentru a le urmări și a le vizualiza. Descoperirea și dezvoltarea lor au fost recompensate cu Premiul Nobel pentru chimie în anul 2008.

• CITEŞTE ŞI:  De ce clipim? Explicaţia cercetătorilor este neaşteptată

Modelul a generat 96 de proteine cu secvențe și structuri susceptibile de a produce fluorescență. Cercetătorii au ales apoi proteina cu cele mai puține secvențe în comun cu proteinele fluorescente naturale. Deși această proteină era de 50 de ori mai puțin luminoasă decât proteinele fluorescente verzi naturale, ESM3 a generat o altă iterație care a condus la noi secvențe care au crescut luminozitatea. Iar rezultatul a fost o proteină fluorescentă verde diferită de toate cele găsite în natură, denumită „esmGPF”.

Echipa EvolutionaryScale a estimat că aceste iterații, realizate în câteva momente de către inteligența artificială, ar necesita 500 de milioane de ani de evoluție pentru a fi realizate. Aşadar, trebuie să ne aşteptăm la o evoluţie şi mai rapidă decât am experimentat până acum.

Publicitate

Abonaţi-vă la newsletter folosind butonul de mai jos, pentru a primi - periodic şi gratuit - o notificare pe adresa de email atunci când publicăm articole interesante: