#MID025 | Italians Do It Better (?)
Se qualcuno se lo stesse già chiedendo: “No, il punto interrogativo nel titolo di questo articolo non è un errore di battitura”.
Sebbene l’idea di avere un LLM tutto italiano, per giunta open source, sia senz’altro affascinante, la concretezza e l’affidabilità del progetto dovrà essere verificata sul campo.
Il nome del modello di Intelligenza Artificiale realizzato da Cineca in collaborazione con iGenius, “Modello Italia”, è già tutto un programma. Ve lo immaginereste mai un modello americano denominato semplicemente “Modello USA”?
Cos’è il “Modello Italia”?
Insomma, sebbene un po' di sano campanilismo in salsa italiana sembri trasparire da ogni poro, nessuno (e quando dico nessuno, intendo proprio nessuno!) ha intenzione di mettere in discussione - a priori - un obiettivo che rivoluzionerebbe completamente il posizionamento del nostro paese nella scalata verso l’innovazione. Al momento, il rilascio del “Modello Italia” è previsto entro l’estate del 2024. Vedremo.
Al di là di qualche piccolo e comprensibile dubbio, una cosa è certa: dalla nostra parte, abbiamo il supercomputer Leonardo (cosa non da poco), gestito da Cineca, con una potenza di calcolo aggregata di 250 PFLOPS e 270 PFLOPS di picco, e l’expertise verticale di iGenius in area AI.
In una interessante intervista pubblicata su Wired, l’Amministratore Delegato di iGenius, Uljan Sharka, ne ha evidenziato le potenzialità e le particolarità, parlando di “democratizzazione dell’accesso alle tecnologie”, tema di cui vi ho parlato anche in #MID022, e di “dataset con licenza aperta e filtri che evitino l'impiego di contenuti protetti”. Insomma, in parole povere, stiamo parlando di un sistema di Intelligenza Artificiale open source (in particolare, realizzato su licenza Mit) e attento alla privacy.
Quindi, al di là delle reali prospettive del progetto, la combo Cineca-iGenius, su qualcosa, ha già colpito nel segno, ovvero, puntare su due fra i temi che, già nel corso del 2024, potrebbero segnare il vero punto di svolta per l’intero settore AI: l’accessibilità alle tecnologie e il copyright.
Intanto, in Francia…
L’obiettivo è, ovviamente, quello di contrastare i superpoteri dei grandi colossi americani (OpenAI e Microsoft su tutti), proponendo un modello più trasparente ed eticamente responsabile, sulla falsa riga dello sfidante progetto recentemente lanciato da Mozilla. Ma non finisce qui.
Qualcosa si sta muovendo, pensate un po’, anche in Francia, e la direzione intrapresa sembrerebbe essere la stessa, ovvero puntare su open source (su licenza Apache 2.0), trasparenza e, soprattutto, la possibilità di connettere diversi ecosistemi.
La startup francese Mistral AI ha infatti annunciato (grazie ad un significativo ed ulteriore round di finanziamento di 385 milioni di dollari) il rilascio di un LLM, denominato 8X7B (tra due minuti, ce lo dimenticheremo!), a suo modo di vedere, potente e sostenibile, in grado di competere (superandoli, in termini di prestazioni) con Llama 2 e GPT 3.5.
Al di là di questi aspetti, di natura prestazionale, ciò che mi fa quasi sobbalzare dalla sedia è soprattutto l’approccio: pare che 8X7B abbia, infatti, un’architettura interna piuttosto particolare, denominata “Mixture of Experts (MoE)”, che prevede, come dice il nome stesso, un numero limitato di esperti, ciascuno specializzato in determinati compiti.
In pratica, invece di fare affidamento su un unico decisore all’interno di una organizzazione, il processo decisionale verrebbe svolto da un comitato ben informato, con competenze specifiche e diversificate. Che dire? Affascinante!
Emozioni e paralisi
Vi lascio con un pensiero, senz’altro, emozionante ma, al tempo stesso, anche paralizzante: come sostiene da qualche tempo la “piccola” Mozilla, una terza via per l’Intelligenza Artificiale è possibile e, come abbiamo visto, non solo in USA. Eppure, riuscire ad intraprenderla, paradossalmente, non è così agevole. Tutt’altro. Ci vogliono moltissimi soldi!
Senza un coinvolgimento attivo degli stessi “potenti della tecnologia”, contro cui questi nuovi modelli open source si stanno (a mio avviso, giustamente) scagliando, la sostenibilità dei relativi progetti, probabilmente, sarebbe solo una chimera. La tematica è complessa. Più di quanto potrebbe apparentemente sembrare.


