Nuovo Modello di Intelligenza Artificiale Avanza il “Problema dei Baci” e Altro
C’è un concetto matematico chiamato il numero di contatto. Un po’ deludente, non ha nulla a che fare con i baci veri. Enumera quanti sfere possono toccare (o “baciare”) una singola sfera di dimensioni uguali senza attraversarla. In una dimensione, il numero di contatto è 2. In due dimensioni, è 6 (pensa alla configurazione del puzzle di The New York Times del bee spelling). Man mano che il numero di dimensioni cresce, la risposta diventa meno ovvia: per la maggior parte delle dimensionalità oltre 4, sono noti solo limiti superiori e inferiori sul numero di contatto. Ora, un agente di intelligenza artificiale sviluppato da Google DeepMind chiamato AlphaEvolve ha dato il suo contributo al problema, aumentando il limite inferiore sul numero di contatto in 11 dimensioni da 592 a 593.
Questo potrebbe sembrare un miglioramento incrementale del problema, specialmente considerando che il limite superiore sul numero di contatto in 11 dimensioni è 868, quindi l’intervallo sconosciuto è ancora piuttosto ampio. Ma rappresenta una nuova scoperta matematica da parte di un agente di intelligenza artificiale e mette in discussione l’idea che i grandi modelli linguistici non siano capaci di contributi scientifici originali.

E questo è solo un esempio di ciò che AlphaEvolve ha realizzato. “Abbiamo applicato AlphaEvolve a una serie di problemi aperti nella matematica della ricerca, e abbiamo scelto deliberatamente problemi da diverse parti della matematica: analisi, combinatoria, geometria”, dice Matej Balog, un ricercatore di DeepMind che ha lavorato al progetto. Hanno scoperto che per il 75 percento dei problemi, il modello di intelligenza artificiale ha replicato la soluzione ottimale già conosciuta. Nel 20 percento dei casi, ha trovato un nuovo ottimo che superava qualsiasi soluzione conosciuta. “Ogni singolo caso del genere è una nuova scoperta”, dice Balog. (Nei restanti 5 percento dei casi, l’intelligenza artificiale ha convergito su una soluzione peggiore rispetto a quella ottimale conosciuta).
Il modello ha anche sviluppato un nuovo algoritmo per la moltiplicazione di matrici, l’operazione alla base di gran parte dell’apprendimento automatico. Una versione precedente del modello di intelligenza artificiale di DeepMind, chiamata AlphaTensor, aveva già superato il precedente algoritmo migliore conosciuto, scoperto nel 1969, per la moltiplicazione di matrici 4×4. AlphaEvolve ha trovato una versione più generale di quell’algoritmo migliorato.
Il modello AlphaEvolve di DeepMind ha apportato miglioramenti a diversi problemi pratici presso Google.Google DeepMind
Oltre alla matematica astratta, il team ha applicato il loro modello a problemi pratici che Google come azienda affronta ogni giorno. L’intelligenza artificiale è stata utilizzata anche per ottimizzare l’orchestrazione dei data center per ottenere un miglioramento del 1 percento, per ottimizzare il design della prossima unità di elaborazione tensoriale di Google e per scoprire un miglioramento a un kernel utilizzato nella formazione di Gemini che ha portato a una riduzione del 1 percento del tempo di formazione.
“È molto sorprendente che si possano fare così tante cose diverse con un unico sistema”, dice Alexander Novikov, un ricercatore senior di DeepMind che ha anche lavorato su AlphaEvolve.
Come Funziona AlphaEvolve
AlphaEvolve è così generale perché può essere applicato a quasi ogni problema che può essere espresso come codice e che può essere verificato da un altro pezzo di codice. L’utente fornisce un primo tentativo del problema, un programma che risolve il problema in questione, anche se in modo subottimale, e un programma verificatore che controlla quanto bene un pezzo di codice soddisfa i criteri richiesti.
Successivamente, un grande modello linguistico, in questo caso Gemini, propone altri programmi candidati per risolvere lo stesso problema, e ognuno viene testato dal verificatore. Da lì, AlphaEvolve utilizza un algoritmo genetico in modo che i “più adatti” delle soluzioni proposte sopravvivano ed evolvano alla generazione successiva. Questo processo si ripete finché le soluzioni smettono di migliorare.
AlphaEvolve utilizza un insieme di grandi modelli linguistici Gemini in congiunzione con un codice di valutazione, il tutto orchestrato da un algoritmo genetico per ottimizzare un pezzo di codice.Google DeepMind
“I grandi modelli linguistici sono arrivati, e abbiamo iniziato a chiederci se è il caso che aggiungano solo ciò che è nei dati di addestramento, o se possiamo effettivamente usarli per scoprire qualcosa di completamente nuovo, nuovi algoritmi o nuove conoscenze”, dice Balog. Questa ricerca, sostiene Balog, dimostra che “se si utilizzano i grandi modelli linguistici nel modo giusto, allora si può, in un senso molto preciso, ottenere qualcosa di provabilmente nuovo e provabilmente corretto sotto forma di un algoritmo.”
AlphaEvolve proviene da una lunga linea di modelli di DeepMind, risalendo ad AlphaZero, che ha stupito il mondo imparando a giocare a scacchi, Go e altri giochi meglio di qualsiasi giocatore umano senza utilizzare alcuna conoscenza umana, solo giocando e utilizzando il reinforcement learning per padroneggiarlo. Un’altra intelligenza artificiale risolutrice di problemi matematici basata sul reinforcement learning, AlphaProof, ha ottenuto un risultato di medaglia d’argento alla Olimpiade Internazionale di Matematica 2024.
Tuttavia, per AlphaEvolve, il team si è discostato dalla tradizione del reinforcement learning a favore dell’algoritmo genetico. “Il sistema è molto più semplice”, dice Balog. “E questo ha conseguenze, è molto più facile da configurare su una vasta gamma di problemi.”
Il (Assolutamente Non Spaventoso) Futuro
Il team dietro AlphaEvolve spera di evolvere il loro sistema in due modi.
Prima di tutto, vogliono applicarlo a una gamma più ampia di problemi, inclusi quelli nelle scienze naturali. Per perseguire questo obiettivo, stanno pianificando di aprire un programma di accesso anticipato per accademici interessati a utilizzare AlphaEvolve nella loro ricerca. Potrebbe essere più difficile adattare il sistema alle scienze naturali, poiché la verifica delle soluzioni proposte potrebbe essere meno diretta. Ma, dice Balog, “Sappiamo che nelle scienze naturali ci sono molti simulatori per diversi tipi di problemi, e quindi quelli possono essere utilizzati anche all’interno di AlphaEvolve. E siamo, in futuro, molto interessati ad ampliare il campo in questa direzione.”
In secondo luogo, vogliono migliorare il sistema stesso, forse accoppiandolo con un altro progetto di DeepMind: il coscientista di intelligenza artificiale. Questa intelligenza artificiale utilizza anche un LLM e un algoritmo genetico, ma si concentra sulla generazione di ipotesi in linguaggio naturale. “Sviluppano queste idee e ipotesi di alto livello”, dice Balog. “Incorporare questo componente in sistemi simili ad AlphaEvolve, credo, ci permetterà di raggiungere livelli più elevati di astrazione.”
Queste prospettive sono entusiasmanti, ma per alcuni potrebbero anche sembrare minacciose: ad esempio, l’ottimizzazione di AlphaEvolve della formazione di Gemini potrebbe essere vista come l’inizio di un’intelligenza artificiale che si auto-migliora in modo ricorsivo, il che alcuni temono potrebbe portare a un’esplosione di intelligenza incontrollata nota come la singolarità. Il team di DeepMind sostiene che non è questo il loro obiettivo, ovviamente. “Siamo entusiasti di contribuire all’avanzamento dell’intelligenza artificiale a vantaggio dell’umanità”, dice Novikov.