#MID092 | Le parole contano
Immaginate un mondo in cui ogni contenuto pubblicato online non fosse solo letto, ma anche remunerato.
C’era una volta il web libero, aperto, un po’ ingenuo: chi pubblicava un testo, una foto, un meme o un tutorial, lo faceva con la beata illusione che qualcuno lo avrebbe letto, forse condiviso, magari persino apprezzato. Poi sono arrivati i bot, i crawler, e, infine, l’Intelligenza Artificiale: famelica, instancabile, sempre pronta a divorare contenuti per trasformarli in addestramento, dataset e risposte generate all’istante. E qui si è accesa la lampadina: perché mai gli editori e i creatori di contenuti dovrebbero regalare tutto questo ben di Dio senza ricevere nulla in cambio?
È in questo contesto che nasce l’RSL Standard, acronimo di Really Simple Licensing. Un nome che ricorda vagamente il vecchio Really Simple Syndication (RSS), ma che, in realtà, è tutta un’altra storia. Qui non si parla di diffondere i contenuti, bensì di mettere paletti e cartelli di prezzo all’ingresso del banchetto digitale. In pratica, il RSL Standard consente ai siti web di specificare condizioni di licenza per l’utilizzo dei loro contenuti da parte delle Intelligenze Artificiali. Non ci si limita più al vecchio robots.txt, che autorizzava o vietava l’ingresso ai crawler. Con RSL, si può andare oltre: stabilire che il contenuto è, sì, accessibile, ma solo a condizione che il bot accetti di firmare un contratto, paghi una licenza, o lo utilizzi in un modo specifico. Il tutto è gestito dalla RSL Collective, una sorta di “società di gestione dei diritti” in salsa tecnologica, che coordina lo standard, promuove adesioni e - almeno sulla carta - prova a garantire che le regole vengano rispettate.
A credere subito nel progetto ci sono nomi noti del panorama tecnologico internazionale: Reddit, Yahoo, Quora, Medium, wikiHow. Insomma, piattaforme che producono o ospitano grandi quantità di contenuti generati dagli utenti e che, senza troppi giri di parole, non hanno alcuna voglia di vedere il proprio materiale fagocitato da un chatbot senza un adeguato ritorno economico. Non è un caso: questi siti sono spesso al centro dell’attenzione quando si parla di “saccheggio” di dati per l’addestramento delle Intelligenza Artificiali. Pensiamo a Reddit: milioni di discussioni, conversazioni, storie, esperienze personali. Tutto materiale perfetto per insegnare alle macchine a parlare come noi. Ma perché regalarlo? Il bello dell’RSL Standard è che non si limita ad un divieto. Propone un modello flessibile di compenso: abbonamenti, pagamenti per scansione, pagamenti per inferenza (cioè, in pratica, quando un modello usa davvero quel contenuto per generare un output).
L’idea, sulla carta, è molto stimolante: garantire una certa equità agli autori, che finalmente potrebbero ricevere qualcosa in cambio; evitare trattative one-to-one tra singoli editori e colossi dell’AI; offrire trasparenza, perché, se le regole sono chiare, non ci si può nascondere dietro la consueta ambiguità legale. Naturalmente, come ogni buona iniziativa che promette di “mettere ordine” nel Far West digitale, anche qui i problemi non mancano.
Primo: gli algoritmi dovrebbero rispettare lo standard. Ma se un’azienda decide di ignorarlo, chi può fermarla? Non c’è un gendarme del web pronto a multare i trasgressori. Secondo: l’enforcement. Dimostrare che un modello AI abbia davvero utilizzato quel contenuto è complicatissimo. Come si fa a provare che una frase o un concetto sia stato utilizzato per addestrare un modello? Terzo: la questione della misurazione. Ammesso che le aziende AI accettino di pagare, come si calcolerebbero i costi? Con quali metriche? Quarto: il rischio di frammentazione. Se lo utilizzassero solo i grandi publisher, le Intelligenze Artificiali potrebbero semplicemente bypassarli e concentrarsi sui contenuti di siti più piccoli o meno protetti. Risultato: i grandi guadagnerebbero, i piccoli resterebbero invisibili.
C’è poi una certa ironia di fondo: il web è nato libero, aperto, quasi anarchico. Oggi, invece, si tenta di recintarlo, tariffarlo, monetizzarlo pezzo per pezzo. Un passaggio forse inevitabile, ma che lascia un po’ di nostalgia per i tempi in cui si scriveva un post sperando in qualche like, non in una fattura digitale ad OpenAI.
Una cosa è certa: se l’RSL Standard riuscirà davvero ad imporsi come standard diffuso, potrebbe cambiare radicalmente i rapporti di forza tra creatori e modelli di Intelligenza Artificiale. Ma la strada è lunga, accidentata e piena di variabili. Non basta scrivere un regolamento per cambiare le regole del gioco. Serve la volontà dei giganti dell’AI (cosa tutt’altro che scontata!), serve un supporto legale internazionale, e serve - diciamolo - che gli editori abbiano la pazienza (e i mezzi) per portare avanti questa battaglia. Ce la faranno?
La "valle perturbante" non è un semplice bug o un problema di latenza, risolvibile con un po' di codice in più. È un precipizio, un vuoto improvviso che si apre proprio quando credi di aver costruito l'esperienza utente perfetta. [Andrea Camerino]
👉 Il mio nuovo saggio - Sull'orlo del "quasi": manuale di sopravvivenza per naufraghi digitali - è disponibile su Amazon, sia in formato Kindle che in versione cartacea.





