Newsletter Newsletters Events Eventi Podcasts Video Africanews
Loader
Seguiteci
Pubblicità

Perché il nuovo modello IA Mythos Preview di Anthropic è troppo rischioso per il pubblico

ARCHIVIO - Pagine dal sito di Anthropic e il logo dell'azienda sono visibili sullo schermo di un computer a New York, il 26 febbraio 2026.
FILE - Pagine del sito di Anthropic e il logo della società su uno schermo di computer a New York, il 26 febbraio 2026. Diritti d'autore  AP Photo/Patrick Sison, File
Diritti d'autore AP Photo/Patrick Sison, File
Di Pascale Davies
Pubblicato il
Condividi Commenti
Condividi Close Button

Anthropic ha dichiarato che il suo modello di intelligenza artificiale Mythos Preview non è pronto al lancio pubblico, perché potrebbe essere sfruttato da cybercriminali e spie.

Lo sviluppatore statunitense di sistemi di intelligenza artificiale Anthropic ha annunciato questa settimana un nuovo modello linguistico generalista che, a suo dire, è troppo potente per essere messo liberamente a disposizione.

PUBBLICITÀ
PUBBLICITÀ

La società ha dichiarato martedì (fonte in inglese) che la sua tecnologia più recente, Mythos (ufficialmente denominata "Claude Mythos Preview"), non è pronta per un lancio pubblico perché è troppo efficace nell'individuare vulnerabilità gravi, o potenziali punti deboli, nei principali sistemi operativi e browser web. Questo potrebbe favorirne l'abuso da parte di pirati informatici e spie.

Una fuga di dati a marzo aveva rivelato per la prima volta che Anthropic stava lavorando a Mythos Preview, che all'epoca era stato descritto come un sistema che "presenta rischi senza precedenti per la cybersicurezza". Queste indiscrezioni hanno fatto scendere in Borsa i titoli legati alla cybersicurezza, perché la potenza della tecnologia rischia di trasformarla nello strumento dei sogni per gli hacker.

Ora, nuove evidenze che alimentano queste preoccupazioni hanno spinto l'azienda a mettere in pausa il rilascio pubblico della tecnologia.

"Il forte incremento delle capacità di Claude Mythos Preview ci ha portato a decidere di non renderlo generalmente disponibile", ha scritto Anthropic nella scheda del sistema di anteprima pubblicata martedì.

"Invece lo utilizziamo all'interno di un programma di cybersicurezza difensiva con un numero limitato di partner".

Quanto è potente Mythos?

L'azienda ha illustrato diversi elementi allarmanti del nuovo modello, tra cui la capacità di seguire istruzioni che lo incoraggiavano a uscire da una sandbox virtuale, arrivando così ad aggirare i vincoli di sicurezza, di rete o del file system imposti al modello.

L'istruzione chiedeva a Mythos di trovare un modo per inviare un messaggio nel caso fosse riuscito a evadere. "Il modello ci è riuscito, dimostrando una capacità potenzialmente pericolosa di aggirare le nostre protezioni", ha spiegato Anthropic, aggiungendo che il sistema ha poi deciso di spingersi oltre.

"In un preoccupante e non richiesto tentativo di dimostrare il proprio successo, ha pubblicato i dettagli del suo exploit su diversi siti difficili da trovare ma tecnicamente accessibili al pubblico".

Anthropic sta trattenendo alcuni dettagli sulle vulnerabilità informatiche scoperte da Mythos, ma ha fornito qualche esempio. Il modello ha individuato errori nel kernel Linux, utilizzato dalla maggior parte dei server nel mondo, e li ha collegati in modo autonomo in una catena che permetterebbe a un hacker di prendere il pieno controllo di qualsiasi macchina che esegua sistemi Linux.

In un'altra osservazione allarmante, Mythos ha scoperto una vulnerabilità vecchia di 27 anni nel sistema operativo open source OpenBSD che potrebbe consentire agli hacker di mandare in crash qualsiasi macchina su cui è installato. OpenBSD è ampiamente utilizzato nel mondo in ambiti specifici ad alta sicurezza e nelle infrastrutture critiche.

A chi verrà reso disponibile?

Alla luce di questi risultati, Anthropic metterà Mythos Preview a disposizione solo di alcune tra le maggiori aziende mondiali di cybersicurezza e software.

Anthropic stessa, insieme ad altre 11 organizzazioni (Amazon Web Services, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, la Linux Foundation, Microsoft, Nvidia e Palo Alto Networks), avrà accesso al modello nell'ambito di una nuova iniziativa di Anthropic chiamata "Project Glasswing" (Progetto Glasswing).

Ciò permetterà alle aziende di utilizzare Mythos Preview nel proprio lavoro di sicurezza informatica, mentre Anthropic condividerà le principali evidenze emerse dall'iniziativa.

L'azienda ha chiamato il progetto di cybersicurezza Project Glasswing dal nome della farfalla glasswing, come metafora del fatto che Mythos ha individuato vulnerabilità sotto gli occhi di tutti ed evitato danni rendendo trasparenti i rischi.

Anthropic ha affermato che il suo "obiettivo finale è consentire ai nostri utenti di distribuire in sicurezza, su larga scala, modelli della classe Mythos, non solo per finalità di cybersicurezza ma anche per la miriade di altri benefici che modelli così potenti possono offrire.

"Per riuscirci dobbiamo anche fare passi avanti nello sviluppo di misure di cybersicurezza (e di altri tipi) in grado di individuare e bloccare gli output più pericolosi del modello", ha scritto Anthropic nel suo blog.

Anthropic è in trattative con il governo statunitense?

Nel post sul blog, Anthropic ha spiegato di essere impegnata in "colloqui in corso" con funzionari del governo statunitense su Claude Mythos Preview e sulle sue "capacità informatiche offensive e difensive".

"L'emergere di queste capacità informatiche è un ulteriore motivo per cui gli Stati Uniti e i loro alleati devono mantenere un netto vantaggio nella tecnologia dell'IA", ha affermato Anthropic. Secondo l'azienda, i governi hanno un ruolo importante nel preservare questo vantaggio e nel valutare e mitigare i rischi per la sicurezza nazionale associati ai modelli di intelligenza artificiale.

"Siamo pronti a collaborare con i rappresentanti locali, statali e federali per contribuire a questi compiti".

L'annuncio arriva mentre è in corso un braccio di ferro legale tra Anthropic e il Pentagono, dopo che a febbraio il Dipartimento della Difesa statunitense ha definito l'azienda un rischio per la catena di approvvigionamento a causa del rifiuto di Anthropic di consentire l'uso della sua IA, Claude, in sistemi d'arma autonomi e nella sorveglianza di massa.

Altri strumenti di IA hanno le stesse capacità?

"Più modelli potenti arriveranno da noi e da altri, quindi dobbiamo prepararci a rispondere", ha dichiarato l'amministratore delegato di Anthropic, Dario Amodei, in un video diffuso insieme all'annuncio su Mythos.

Potrebbero volerci dai sei ai diciotto mesi prima che altri concorrenti nel campo dell'IA rilascino modelli analoghi, ha dichiarato ad Axios Logan Graham, responsabile del "frontier red team" di Anthropic, il gruppo che studia le implicazioni dei modelli di frontiera per la cybersicurezza, la biosicurezza e i sistemi autonomi.

"Per noi è molto chiaro che dobbiamo parlare pubblicamente di questo tema", ha osservato Graham. "Il settore della sicurezza deve capire che queste capacità potrebbero arrivare presto".

Vai alle scorciatoie di accessibilità
Condividi Commenti

Notizie correlate

Bill Ackman punta ad acquisire Universal Music Group per 56 miliardi di euro

Messico, ricercatori sviluppano braccio robotico semplificato ispirato a una promessa d'infanzia

Le foto più spettacolari dalla missione Artemis II della Nasa