#MID024 | Allucinazioni artificiali
Le allucinazioni delle AI posso verificarsi per diversi motivi, sebbene il filo conduttore di ciascuna di esse dipenda essenzialmente da una erronea interpretazione dei dati.
Dopo averla solo teorizzata nel lontano 2020 (eh, sì, in questo specifico ambito, dove le novità si rincorrono ad una velocità inaudita, si tratta praticamente di ere geologiche!), con la pubblicazione di uno studio dedicato che ne illustrava le enormi potenzialità, negli ultimi tempi, molti ricercatori ed aziende di settore son tornate a parlare di Retrieval-Agumented Generation, soprattutto in relazione alla sua capacità di rispondere in maniera efficace ad un limite piuttosto significativo dell'AI Generativa: le allucinazioni.
Output allucinati
Le allucinazioni delle AI posso verificarsi per diversi motivi, sebbene il filo conduttore di ciascuna di esse dipenda essenzialmente da una erronea interpretazione dei dati.
Il primo dei motivi (spesso definito “rumore nell’addestramento dei dati”) è rappresentato da una potenziale inaccuratezza dell’addestramento, che potrebbe portare ad una classificazione ed “archiviazione” (o, come si suol dire, “etichettatura”) dei dati non corretta.
Poi, c’è il cosiddetto overfitting, ovvero un fenomeno indesiderato che si verifica quando un modello statistico, pur adattandosi perfettamente ai propri dati di addestramento, non è in grado di funzionare correttamente in presenza di dati non osservati in precedenza.
Potrebbe anche esserci un problema di “qualità” del dataset di addestramento, nel quale, come sappiamo, specifici algoritmi di apprendimento automatico reperiscono le informazioni per fornire l’output desiderato. Se le informazioni di partenza fossero incomplete, imprecise oppure, più semplicemente, ambigue, l’Intelligenza Artificiale potrebbe prendere “fischi per fiaschi” e restituirci risultati “fantasiosi”, se non, addirittura, errati.
Infine, ed è soprattutto questo il fattore su cui la RAG (acronimo che sta per Retrieval-Agumented Generation) è in grado di intervenire, potrebbero esserci dei limiti di “contesto”. In pratica, l’Intelligenza Artificiale, pur avendo a propria disposizione un’enorme quantità di informazioni da cui attingere, potrebbe non “comprendere” il reale contesto di riferimento, fornendo risposte fallaci, ovvero generando un “output allucinato”.
RAG e fonti di dati
Insomma, per chi non lo avesse ancora capito, con le allucinazioni delle AI non si scherza, soprattutto in ambienti di business, dove la riproducibilità di un determinato evento o processo può incidere profondamente sull’efficacia complessiva di una offerta commerciale.
Proprio per questo motivo, come vi dicevo anche all’inizio di questo nuovo episodio di Make It Digital, si è ben pensato di riprendere in mano un “vecchio” articolo scritto da Patrick Lewis ed altri ricercatori di Facebook AI Research, "Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks", potendo, finalmente, realizzare concretamente ciò che, allora, era stato solo ipotizzato.
In questo articolo, si fa riferimento alla RAG come ad un processo attraverso il quale è possibile integrare le informazioni contenute in un LLM (Large Language Model) con dati più aggiornati (“locali” e “verticali”), senza la necessità di effettuare un lungo e dispendioso retraining dell’intero sistema.
Le fonti aggiuntive di dati possono essere rappresentate, in generale, da repository in cui siano archiviate informazioni relative ad una specifica organizzazione, come ad esempio, dati strutturati o non strutturati, PDF, articoli del blog, feed delle notizie e trascrizioni di chat, e, più in particolare, dai cosiddetti database vettoriali, che garantiscono una memorizzazione dei dati in formato vettoriale, oltreché una pronta identificazione delle relative fonti. Come vi dicevo, queste informazioni sono richiamabili ed integrabili in fase di query con quelle estratte dal LLM, al fine di restituire un output il più possibile accurato e verticale su uno specifico contesto di riferimento.
Una manna dal cielo per le aziende
In tempi in cui, non solo l’accuratezza, ma anche la velocità delle risposte fornite comincia a rivestire un ruolo sempre più rilevante, l’implementazione di processi, come la RAG, in grado di assecondarla e favorirla, non può che rappresentare una specie di manna dal cielo per molte aziende.
Pur essendo una soluzione più costosa di un “semplice” LLM, nel medio e lungo termine, la possibilità di “non doverci rimettere continuamente le mani” potrebbe garantire un significativo abbattimento dei costi rispetto ad un dispendioso retraining periodico dell’intero sistema.
Insomma, tutto dipende dalle prospettive e, ovviamente, dai propri specifici obiettivi pianificati. Una cosa è certa, però: se correttamente implementata, la Retrieval-Agumented Generation potrebbe rinnovare completamente l’approccio delle aziende alle nuove tecnologie, rendendo sempre più agevole, oltreché vantaggioso, l’utilizzo dell’AI Generativa nei processi di business.


