PHOTO
Grazie a strumenti come ChatGPT e Bard, da qualche mese l'intelligenza artificiale generativa è entrata nelle nostre vite, diventando oggetto di un dibattito molto vivace sull'etica e i diritti legati a questa nuova frontiera tecnologica. Sentiamo parlare di intelligenza artificiale ovunque, ma di cosa si tratta esattamente?
Gli esperti sostengono che nei prossimi anni la maggior parte dei sistemi di intelligenza artificiale disponibili sul mercato saranno sviluppati sulla base dei cosiddetti modelli di fondazione, tanto che le regole europee che li governeranno sono stati al centro del negoziato tra Parlamento e Consiglio UE sul futuro regolamento UE.
Un modello di fondazione è un modello algoritmico che può essere utilizzato alla base di sistemi di IA. Si tratta di un modello solitamente elaborato da una realtà che dispongono di grandi capacità di calcolo, e che può essere utilizzato, da realtà più piccole, come base per i loro sistemi di IA. Semplificando molto, non è troppo diverso da quanto già avviene da tempo nel settore automobilistico, dove alcune case decidono di concentrarsi sulla carrozzeria o su altri elementi specifici, installando nel cofano il motore di un’altra casa, al più riconfigurandolo per l’uso specifico del veicolo. Ciò consente a questi produttori di concentrarsi su particolari aspetti dei propri veicoli senza dover fare grandi investimenti sullo studio del motore, per il quale posso affidarsi a motori già esistenti e notoriamente performanti realizzati da chi ha una più lunga storia di ricerca e sviluppo. Lo stesso avviene in qualche nel mondo dell’intelligenza artificiale, dove alcuni sistemi molto avanzati – i modelli di fondazione – possono essere utilizzati da altri sviluppatori quali “motori” per i propri sistemi.
I modelli di fondazione che si basano sul testo non sono altro che modelli algoritmici che si caratterizzano per avere spiccate conoscenze linguistiche, sintattiche e di ragionamento che hanno appreso leggendo su un enorme quantitativo di dati, spesso raccolti su Internet. Come se chiudessimo una persona in una biblioteca infinita e gli chiedessimo di leggere tutto più e più volte, la conoscenza dei modelli di fondazione è una sorta di conoscenza esperienziale, che nasce dall’analisi di un ampissimo volume di testi presi da Internet al sole fine di capire come le parole si relazionano tra di loro, anche in relazione al contesto, su base probabilistica. Così, parola dopo parola, sulla base della propria esperienza, il modello impara a costruire una frase, mattoncino su mattoncino, interpretando il contesto e aggiungendo, di volta in volta, dopo ogni parola, la parola che più probabilmente si dovrebbe trovare dopo l’ultima parola data.
Ad esempio, se chiedessimo al modello di completare la frase “Invece di mangiare una insalata, Mario ha mangiato una pasta alla …”, questo, all’inizio, potrebbe completarla con frasi casuali, come “martello”. Dopo un po’, però, studiando i testi esistenti, il modello potrebbe aggiungere la parola “bolognese” oppure “norma”. Spiegando poi al modello che Mario vive a Roma, è più probabile che il modello completi la frase con “carbonara” oppure “amatriciana” oppure, se informato sul fatto che è Mario vegetariano, è più probabile che il modello completi la frase con le parole “cacio e pepe”. È esattamente per questo motivo che, come abbiamo imparato in questi mesi, ciò che fa la differenza è proprio il livello di dettaglio della richiesta (che chiamiamo prompt) e tutto il contesto della conversazione.
Questa enorme capacità di elaborazione testuale dei modelli di fondazione costituisce una ricchezza che consente ad altri sviluppatori di sistemi di IA generativi di testo di partire da una solida base per fornire i propri risultati, senza dover reiventare la ruota. Ad esempio, l’editore di un giornale potrebbe richiedere ai propri sviluppatori di utilizzare un modello di fondazione per analizzare il suo intero archivio ed elaborare un sistema generativo di testo capace di redigere degli articoli che rispettino lo stile che fa parte della tradizione del giornale. Ricorrere, in questo caso, a un modello di fondazione consentirebbe all’editore di non dover spendere soldi e tempo per spiegare da zero al proprio sistema di IA il mondo del linguaggio, come i concetti di base della sintassi. Il sistema di IA interno del giornale potrebbe quindi limitarsi ad affinare il modello attraverso un addestramento “di ultimo miglio” basato sul proprio archivio e, eventualmente, anche attraverso ulteriori fasi di addestramento umano.
Perché tutto questo spaventa chi si occupa di etica e diritti fondamentali? Poiché i modelli di fondamento sono ad oggi allenati per lo più sulla base di testi raccolti sulla rete Internet, è possibile che il modello nasconda dei bias culturali comuni. A cascata, questi bias potrebbero essere riflessi nei risultati di ogni sistema di IA che pone quel modello di fondazione quale “motore”, proprio come nell’esempio del sistema di IA dell’editore. E allora, potremmo avere soluzioni di IA generativa che, su richiesta di scrivere un breve racconto ambientato in una clinica, restituiscano la storia di un anziano medico e delle sue brave infermiere, invece che della giovane medica e dei suoi infermieri. L’impatto sui diritti fondamentali è imprevedibile, se pensiamo che sistemi di IA saranno presto usati in ambito di giustizia, sanità, istruzione.
Nell’attesa che la tecnica trovi una soluzione a questi problemi, le future regole europee obbligheranno le società che sviluppano modelli di fondazione a rendere conoscibile il patrimonio informativo utilizzato alla base dell’addestramento, e a ulteriori processi di valutazione, prima dell’immissione sul mercato. Conoscere, per prevenire.