Il cofondatore di Anthropic Jack Clark ha affermato che presto gli agenti di IA potrebbero costruire e addestrare da soli i modelli e che, se accadrà, gli esseri umani rischiano di perdere il controllo sui sistemi di IA.
Jack Clark, cofondatore di Anthropic, vuole che il settore dell’intelligenza artificiale metta un freno prima che la tecnologia inizi a svilupparsi ulteriormente da sola, senza intervento umano.
Parlando alla BBC, Clark ha affermato che l’80% del lavoro di programmazione di Anthropic è già svolto dall’IA Claude e che questa quota potrebbe arrivare al 100% nel giro di un paio d’anni. Tuttavia, ha sottolineato che “è una scelta” se le aziende di IA lasceranno che si arrivi a questo punto senza intervenire.
“Pensiamo che questo sia un tema di cui il mondo dovrebbe parlare di più”, ha detto Clark. “L’industria dell’IA oggi ha un pedale dell’acceleratore, ma non ha un pedale del freno, e noi vogliamo contribuire a costruire quel pedale”.
Questo processo è chiamato “auto-miglioramento ricorsivo”: è quando un’IA è in grado di migliorare se stessa senza input umani, secondo quanto spiegato da Anthropic in un post correlato sul blog (fonte in inglese) pubblicato giovedì sera.
In un modello ricorsivo, gli agenti di IA, ossia lavoratori autonomi creati da un chatbot, potrebbero “diventare abbastanza capaci da costruire e addestrare da soli nuovi modelli”, così che Claude “potrebbe essere migliorato continuamente da Claude”, ha spiegato Anthropic.
Sebbene un’IA ricorsiva possa portare benefici alla scienza e alla sanità, Anthropic avverte che potrebbe anche aumentare “i rischi che gli esseri umani perdano il controllo sui sistemi di IA”.
“Se i sistemi sono in grado di costruire completamente da soli i propri successori, diventa molto più importante il modo in cui li mettiamo in sicurezza, li monitoriamo e ne orientiamo il comportamento”, si legge nel post.
Secondo Anthropic, ci sono indizi all’interno del suo stesso modello che la ricorsione potrebbe arrivare prima del previsto. L’azienda cita il fatto che il tasso di correzione del codice da parte del personale è in calo costante da un anno, il che significa che ci sono sempre meno errori in ciò che produce Claude.
Claude è inoltre in grado di condurre autonomamente esperimenti di ricerca quando gli viene posta una domanda aperta, come “Un modello meno potente può supervisionarne uno più potente?”, e di elaborare soluzioni proprie senza intervento umano.
“Le evidenze suggeriscono che il ruolo umano si sta restringendo a ogni fase del processo di sviluppo dell’IA”, si legge ancora nel blog.
Anthropic ha dichiarato che il suo istituto condurrà ricerche per creare un sistema capace di verificare se gli sviluppatori hanno effettivamente fermato, o rallentato, il passaggio verso l’IA ricorsiva.
Tuttavia, un vero rallentamento richiederebbe che “più laboratori con ampie risorse, al livello o vicino al livello più avanzato, in diversi Paesi, accettino di fermarsi alle stesse condizioni”.