Înapoi la știri

Șaisprezece agenți Claude AI au creat un nou compilator C

08 Feb 2026
7 minute min
Simona Stan
Șaisprezece agenți Claude AI au creat un nou compilator C

Într-un experiment costisitor de 20.000 de dolari, șaisprezece agenți AI Claude au reușit să compileze un nucleu Linux, dar a fost nevoie de o gestionare umană detaliată. Conform arstechnica.com, cercetătorul Nicholas Carlini a dezvăluit detaliile acestui proiect audacios, care a fost realizat cu minimă supraveghere.

👉 Lansarea și utilizarea agenților AI pentru construirea compilatorului

În cadrul unei inițiative recente care vizează agenții AI, atât Anthropic cât și OpenAI au lansat instrumente multi-agent. Joia trecută, cercetătorul Anthropic, Nicholas Carlini, a publicat un post pe blog explicând cum a folosit 16 instanțe ale modelului AI Claude Opus 4.6 pentru a construi un compilator C de la zero, lucrând pe o bază de cod partajată.

Pe parcursul a două săptămâni și aproape 2.000 de sesiuni Claude Code, costul total ridicându-se la aproximativ 20.000 de dolari în taxe API, agenții modelului AI raportat au generat un compilator bazat pe Rust, format din 100.000 de linii de cod, capabil să compileze un nucleu Linux 6.9 pe arhitecturi x86, ARM și RISC-V.

👉 Performanțele, limitările și implicațiile metodologiei folosite

Carlini, un om de știință al cercetării în echipa de siguranță a Anthropic, care a petrecut anterior șapte ani la Google Brain și DeepMind, a folosit o nouă caracteristică introdusă cu Claude Opus 4.6 numită "echipe de agenți." Fiecare instanță Claude a rulat în interiorul propriului container Docker, clonând un depozit Git partajat, revendicând sarcini prin scrierea fișierelor de blocare și apoi împingând codul completat în sus.

Niciun agent de orchestrare nu a dirijat traficul, iar fiecare instanță a identificat în mod independent problemele de rezolvat. Când au apărut conflicte de îmbinare, instanțele modelului AI le-au rezolvat de una singură. Compilatorul rezultat, pe care Anthropic l-a publicat pe GitHub, poate compila o gamă de proiecte majore open source, inclusiv PostgreSQL, SQLite, Redis, FFmpeg și QEMU.

Acesta a avut o rată de succes de 99% la suitele de teste GCC torture și, în ceea ce Carlini a numit "testul suprem al dezvoltatorilor," a compilat și a rulat jocul Doom. Este important de menționat că un compilator C reprezintă o sarcină aproape ideală pentru codarea AI semi-autonomă: specificația sa este bine definită și există suite de teste cuprinzătoare și un compilator de referință cunoscut pentru validare.

Cu toate acestea, Carlini a recunoscut clar limitările compilatorului. Acesta nu dispune de un backend x86 de 16 biți necesar pentru a boota Linux din modul real, așa că a apelat la GCC pentru acest pas. Asamblorul și linkerul proprii au rămas cu bug-uri, iar chiar și cu toate optimizările activate, compilatorul produce cod mai puțin eficient comparativ cu GCC rulat cu toate optimizările dezactivate.

Calitatea codului Rust, deși funcțională, nu se apropie de ceea ce un programator expert Rust ar produce. "Compilatorul rezultat a atins aproape limitele abilităților Opus," a afirmat Carlini. "Am încercat (din greu!) să remediez mai multe dintre aceste limitări, dar nu am avut succes complet. Funcționalități noi și corecturi frecvent au rupt funcționalitatea existentă."

Aceste limitări sunt poate mai informative decât succesele în sine. Carlini a raportat că, spre sfârșitul proiectului, remedierea bug-urilor și adăugarea de funcționalități "au rupt frecvent funcționalitatea existentă," un tipar familiar pentru cei care au observat creșterea unei baze de cod care depășește momentul în care orice colaborator înțelege pe deplin.

Carlini a spus că este important ca verificatorul de sarcini să fie aproape perfect, altfel Claude va rezolva problema greșită. "Claude va lucra autonom pentru a soluționa orice problemă îi dau," a concluzionat el.

În final, metodologia agenților paraleli care coordonează prin Git cu supraveghere umană minimă este inovatoare, iar trucurile de inginerie pe care Carlini le-a dezvoltat pentru a menține agenții productivi ar putea reprezenta contribuții utile în utilizarea pe scară largă a instrumentelor de dezvoltare software agențice. De asemenea, el a recunoscut că se simte conflictual în legătură cu propria sa realizare, notând că "gândul programatorilor care desfășoară software pe care nu l-au verificat personal este o preocupare reală."

Alte postari din Economie
Economie

Verdictele împotriva Meta și Google ar putea aduce o nouă eră de responsabilitate în tehnologie

Mary Rodee, a cărei fiu de 15 ani s-a sinucis, indică un banner cu numele victimelor în fața Tribunalului Superior din Los Angeles pe 25 martie, după ce un juriu a găsit Meta și YouTube răspunzătoare pentru vătămarea unei tinere prin designul lor adictiv. Verdictul istoric ar putea transforma modul în care industria tehnologică se confruntă cu responsabilitatea legală pentru daunele cauzate utilizatorilor.

Economie

Parohia Grădiștea susține educația tinerilor prin proiecte valoroase

Parohia Grădiștea, sub îndrumarea părintelui paroh Dumitru Teodor-Georgian, oferă tinerilor din comunitate oportunități de învățătură esențiale pentru dezvoltarea lor personală. Potrivit jurnaluldeilfov.ro, activitățile desfășurate aici îi învață pe tineri valori importante, precum iubirea față de familie și respectul reciproc.

Economie

Delta flight's engine explodes in heart-stopping video — forcing packed plane to make emergency landing - New York Post

A Delta plane was forced to make an emergency landing in Brazil late Sunday after an apparent engine glitch sent flames and sparks shooting from the packed jet. Delta Flight DL104, which was bound for Atlanta with 272 passengers and 14 crew on board, suffered a mechanical issue with its left engine as it was taking off at Sao Paulo’s Guarulhos International Airport.

Economie

Copiii și polițiștii din Ilfov au interacționat într-un eveniment educativ captivant

Într-un eveniment captivant dedicat copiilor, părinților și profesorilor, polițiștii din Ilfov au organizat o zi plină de activități interactive, conform jurnaluldeilfov.ro. Participanții au avut ocazia să exploreze standuri informative și să participe la demonstrații despre echipamentele și tehnicile utilizate în menținerea ordinii publice, toate într-un mediu educativ și distractiv.

Acasa Recente Radio Județe