Intelligenza Artificiale: quando l'umanità deve fermarsi prima di superare il punto di non ritorno?

7 Settembre 2024

Il team di Google DeepMind propone un sistema per classificare le capacità dell'Intelligenza Artificiale, aprendo la strada a un'analisi più chiara e sicura del cammino verso l'AGI.

Il mondo dell’intelligenza artificiale è in continua evoluzione, e uno dei traguardi più ambiziosi è lo sviluppo dell’Artificial General Intelligence (AGI), ovvero un’intelligenza artificiale capace di svolgere qualsiasi compito cognitivo umano. Un team di ricercatori di Google DeepMind, ha recentemente pubblicato un documento che propone un nuovo modo di classificare le capacità dei modelli AI esistenti e futuri.

Questo paper introduce una struttura a "livelli" per descrivere la profondità e l'ampiezza delle capacità dei modelli di AI, offrendo un linguaggio comune per confrontare i progressi verso l'AGI. L'obiettivo è facilitare il confronto tra modelli, valutare i rischi associati all'intelligenza artificiale avanzata e stabilire un quadro per misurare lo stato attuale delle tecnologie AI rispetto alla meta ambiziosa dell’AGI.

Nel loro lavoro, i ricercatori di Google DeepMind non si limitano a proporre un nuovo modo di classificare l'AGI, ma esplorano anche alcune delle definizioni più famose e influenti attraverso nove casi di studio. Uno degli esempi più noti è il Turing Test, un concetto storico che cerca di determinare se una macchina possa comportarsi come un essere umano. Tuttavia, oggi questo test non basta per definire un’intelligenza generale. Altri casi di studio si concentrano su idee più moderne, come quella che vede l’AGI non solo come un’intelligenza in grado di svolgere qualsiasi compito, ma anche capace di superare l'uomo in attività di alto valore economico. Ogni esempio aiuta a evidenziare come la definizione di AGI sia ancora in evoluzione.

image?url=%2F next%2Fstatic%2Fmedia%2Fgoogle deepmind logo.6534172c

Dopo aver analizzato queste diverse prospettive, gli autori propongono sei principi fondamentali che una buona definizione di AGI dovrebbe rispettare. In sostanza, il focus deve essere sulle capacità dell’intelligenza artificiale e non su come le raggiunge. L'AGI deve saper affrontare molti compiti, ma soprattutto svolgerli in modo efficace. Non è necessario che esegua azioni fisiche, ma deve avere la capacità di risolvere problemi complessi e imparare nuove abilità. Un aspetto centrale è che, anche se un sistema AGI non viene utilizzato nel mondo reale, le sue potenzialità devono comunque essere considerate rilevanti. I test per valutare l'AGI dovrebbero riflettere compiti reali, quelli che la società considera importanti, e non solo prove teoriche. Infine, l'AGI va vista come un percorso progressivo, fatto di tappe intermedie e miglioramenti continui, piuttosto che un singolo obiettivo da raggiungere.

Il paper introduce anche un sistema di "livelli di AGI" per classificare il progresso verso l'intelligenza artificiale generale. L'idea è quella di suddividere lo sviluppo dell'AGI in diverse fasi, in base a due fattori principali: la profondità delle capacità cioè quanto è bravo un sistema in un determinato compito e l'ampiezza delle stesse cioè in quanti compiti diversi il sistema riesce a essere competente.

Livello Descrizione Esempi
Livello 0: No AI AI non presente, task svolti interamente da umani. Software calcolatrice, editing testo.
Livello 1: Emerging AGI AI con capacità base, migliore di un umano non specializzato in alcuni task limitati. ChatGPT, Bard, Llama 2.
Livello 2: Competent AGI AI che esegue la maggior parte dei compiti cognitivi a un livello competente. Non ancora raggiunto pubblicamente.
Livello 3: Expert AGI AI che supera il 90% degli esseri umani in compiti specifici. Non ancora raggiunto.
Livello 4: Virtuoso AGI AI che eccelle rispetto al 99% degli umani in numerosi compiti. Non ancora raggiunto.
Livello 5: Superhuman AGI AI che supera il 100% degli esseri umani in tutti i compiti cognitivi. Non ancora raggiunto.

Il livello più basso viene definito come "Emerging AGI", che rappresenta quei sistemi che cominciano a mostrare segni di intelligenza generale, ma solo in compiti relativamente semplici e specifici. Un esempio di ciò sono i modelli di linguaggio avanzati come ChatGPT o Bard, che possono eseguire alcuni compiti meglio di un essere umano, ma rimangono limitati a contesti molto specifici.

Salendo di livello, si arriva a "Competent AGI", che descrive un'intelligenza artificiale capace di eseguire la maggior parte dei compiti cognitivi a un livello simile o superiore alla media degli esseri umani. Tuttavia, al momento non esiste ancora un sistema pubblico che abbia raggiunto questo livello. Un AGI di livello "Competent" potrebbe essere in grado di svolgere compiti come scrivere un codice o analizzare grandi quantità di dati in modo molto più efficiente rispetto a un essere umano.

I livelli successivi includono "Expert AGI", che descrive un sistema che può superare il 90% degli esseri umani in numerosi compiti, e "Virtuoso AGI", che rappresenta un'intelligenza in grado di eseguire compiti a un livello talmente avanzato che solo l'1% degli umani potrebbe competere. Infine, c’è il livello massimo, chiamato "Artificial Superintelligence" (ASI), che supererebbe le capacità umane in tutti i compiti cognitivi immaginabili. L'ASI potrebbe non solo essere più intelligente degli esseri umani, ma potrebbe anche sviluppare abilità che noi non possiamo nemmeno immaginare.

Questo sistema a livelli è utile per tracciare il progresso verso l’AGI, permettendo di capire a che punto siamo oggi e quali sfide restano da affrontare. Inoltre, offre una prospettiva più realistica e graduale rispetto all'idea di raggiungere l’AGI come un traguardo unico e definitivo. Invece di concentrarsi solo sulla meta finale, questo approccio consente di monitorare come i sistemi AI stanno evolvendo e quali nuove capacità stanno acquisendo lungo il percorso.

arrow-right