AI generativa: concetti fondamentali e applicazioni

Comprendere i concetti fondamentali sul funzionamento dell’intelligenza artificiale generativa e quali sono le sue principali applicazioni può migliorare l’adoption di questa tecnologia.

L’intelligenza artificiale e l’intelligenza artificiale generativa sono due temi divenuti ormai mainstream negli ultimi due anni. Sebbene studiate da decenni – il termine AI è apparso per la prima volta a metà degli anni ’50 del secolo scorso – è solo recentemente che l’AI e l’AI generativa hanno iniziato ad affacciarsi con forza sul dibattito pubblico, conquistandosi titoli di giornali, libri, servizi in tv, ricerche scientifiche e una grandissima quantità di articoli sul web.

L’AI e l’AI generativa non sono però solo una moda, o quello che nel ciclo di vita e adozione di una tecnologia si chiama hype: sono anche due tecnologie concrete, già entrate a far parte della realtà lavorativa e quotidiana di milioni di persone producendo impatti destinati probabilmente ad aumentare nell’immediato futuro.

Ma cos’è l’AI generativa e come funziona? E quali sono alcune sue applicazioni? Nonostante il grande dibattito su questo argomento non tutti sanno rispondere a queste domande. In questo articolo cerchiamo dunque di spiegare in modo sintetico e chiaro cos’è l’intelligenza artificiale generativa, quali sono i concetti fondamentali alla base del suo funzionamento e quali sono alcune sue applicazioni concrete per le aziende e le persone.

Cos’è l’intelligenza artificiale generativa: una definizione

L’intelligenza artificiale generativa è l’ultimo sviluppo dell’intelligenza artificiale, cioè una tecnologia complessa che però, come spiega l’Osservatorio Artificial Intelligence del Politecnico di Milano, ha alla base un’idea molto semplice: “Sviluppare delle ‘macchine’ dotate di capacità di apprendimento automatico e di adattamento che siano ispirate ai modelli di apprendimento umani”.

L’intelligenza artificiale generativa è un tipo di intelligenza artificiale che usa algoritmi di apprendimento automatico (che in inglese si chiama machine learning) per generare nuovi contenuti che in precedenza erano deputati alla creatività umana. Questi contenuti possono essere testi, immagini, video, audio, o codice informatico.       

Come funziona l’intelligenza artificiale generativa: concetti fondamentali

Già nella definizione è contenuto, in estrema sintesi, il principio di funzionamento dell’AI generativa. Cerchiamo di spiegarlo in maniera più estesa e focalizzandoci sui concetti chiave.

I Foundation models o modelli di base

L’AI si basa su modelli di intelligenza artificiale addestrati su grandi quantità di dati, chiamati foundation models o modelli di base. Cosa sono questi modelli? I foundation models, noti anche come large pre-trained models, sono modelli di intelligenza artificiale pre-addestrati su grandi quantità di dati non etichettati, cioè informazioni grezze o non categorizzate che non sono ancora organizzate in un formato utilizzabile.

Questi modelli sono il punto di partenza per lo sviluppo di modelli specifici per compiti particolari – ad esempio: una traduzione, o un riassunto – permettendo di accelerare notevolmente lo sviluppo e migliorare le prestazioni dei sistemi intelligenti in diversi settori.

I Foundation models utilizzati da software come ChatGPT e in generale quelli utilizzati per l’interpretazione del linguaggio naturale sono chiamati Large language model (LLM), un altro termine che ricorre spesso negli articoli che parlano di intelligenza artificiale generativa. I foundation models hanno tre caratteristiche principali:

  • grande capacità: hanno moltissimi parametri, che li rendono capaci di svolgere una varietà di compiti più ampia rispetto ai modelli tradizionali. Due esempi che fanno capire di che scala parliamo: GPT-3 e 4, modelli di base di OpenAI, utilizzano 175 miliardi di parametri, mentre BERT di Google è un modello di linguaggio naturale che utilizza 100 trilioni di parametri.
  • pre-addestramento: sono addestrati su enormi quantità di dati non etichettati, che li rendono in grado di apprendere schemi e relazioni complessi. I dati non etichettati sono infatti particolarmente utili per il cosiddetto “apprendimento non supervisionato”, un approccio di intelligenza artificiale in cui gli algoritmi cercano di trovare strutture, partner e raggruppamenti intriseci esplorando i dati che non hanno etichette predefinite;
  • emersione: il comportamento dei modelli di base è implicitamente indotto durante il processo di addestramento, senza che vengano espressamente programmati.

Dal prompt alla generazione di nuovi contenuti

Nei programmi di AI generativa come ChatGPT o Copilot, l’assistente virtuale AI-Powered di Microsoft, l’utilizzatore solitamente fornisce un input testuale attraverso un’interfaccia conversazionale, utilizzando il linguaggio naturale. In pratica, scrive un testo o, nell’ultima versione di Open AI, ChatGPT-4, che è multimodale, può fornire anche input visivi. Questi input sono definiti prompt.

Una volta inserito il prompt, l’intelligenza artificiale generativa utilizza il modello di base per prevedere e generare nuovi contenuti come testo, immagini, audio o video, che riflettono le caratteristiche dei dati di addestramento, ma creano qualcosa di nuovo. La capacità generativa risiede nel fatto che i modelli di base, come spiega un articolo pubblicato sui blog degli Osservatori del Politecnico di Milano, “sono in grado di apprendere la distribuzione dei dati di addestramento, studiarne la probabilità di distribuzione e da qui generare contenuti nuovi, che replicano le caratteristiche più probabili dei dati di addestramento”.

Le reti neurali

Come fanno i modelli di base a produrre contenuti nuovi? Il processo di funzionamento si basa su tecniche di apprendimento automatico (in inglese machine learning, altro termine ricorrente negli ultimi anni) come le reti neurali. Cosa sono le reti neurali? Sono modelli di calcolo che imitano il funzionamento del cervello umano. Sono composte da neuroni artificiali interconnessi, che elaborano i dati in ingresso mediante calcoli matematici. Questi neuroni sono organizzati in strati, ognuno dei quali elabora i dati in modo specifico.

Ci sono diversi tipi di reti neurali, ognuno adatto a diversi tipi di dati:

  • reti neurali feed-forward: i dati scorrono in una sola direzione, da uno strato di input a uno strato di output;
  • reti neurali ricorrenti (RNN): elaborano i dati sequenzialmente, come l’apprendimento delle parole in sequenza per elaborare il linguaggio, ma hanno dei limiti sulla lunghezza delle sequenze che si possono fornire nell’input;
  • reti neurali convoluzionali (CNN): utilizzate nell’elaborazione delle immagini;
  • reti neurali transformer: sono alla base di molti dei foundation models di AI generativa per l’elaborazione del linguaggio naturale. Il meccanismo che utilizzano è definito “di attenzione” e segue il processo compiuto dalla mente umana: i transformer analizzano e si concentrano simultaneamente su diverse parti di un input (ad esempio una frase) e apprendono le relazioni di dipendenza a lungo raggio tra queste parti (ad esempio tra i sostantivi, i pronomi, gli aggettivi e i verbi contenuti nella frase).

Le allucinazioni

L’ultimo concetto fondamentale che introduciamo in questo articolo sul funzionamento dell’intelligenza artificiale generativa riguarda uno dei problemi più diffusi di questa tecnologia, le allucinazioni.

Cosa sono? In sintesi, sono situazioni in cui il sistema AI produce output che non sono basati sulla realtà, sulla verità oggettiva o non sono coerenti con i dati di input forniti nel prompt. Le allucinazioni possono manifestarsi in vari modi: il sistema di AI può identificare oggetti inesistenti in alcune immagini o può fornire risposte completamente errate a domande.

Come chiarisce un recente articolo apparso sulla MIT Technology Review, le allucinazioni sono in realtà connaturate al meccanismo di funzionamento probabilistico dei sistemi di intelligenza artificiale generativa. “È tutta un’allucinazione – scrive Will Douglas Heaven –, ma la chiamiamo così solo quando ci accorgiamo che è sbagliata. Il problema è che i modelli linguistici di grandi dimensioni sono così bravi in quello che fanno che quello che inventano sembra giusto la maggior parte delle volte. E questo rende difficile fidarsi di loro”.

Nell’articolo viene citato l’esempio di Sarah (Smart AI resource assistant for health), un chatbot lanciato dall’Organizzazione mondiale della sanità e basato sull’AI generativa che fornisce consigli per una vita più sana. Oltre a migliaia di consigli “giusti”, questo chatbot ha fornito anche pareri sbagliati e ha inventato cliniche inesistenti a cui rivolgersi, spingendo l’OMS a inserire un disclaimer che avverte che l’accuratezza delle risposte non è garantita.  

C’è un modo per ridurre le allucinazioni? C’è chi pensa che addestrare i modelli su un numero sempre maggiore di testi li potrà rendere più accurati. Un altro approccio è chiamato “chain-of-thought prompting” e consiste nel chiedere ai modelli di controllare il proprio lavoro passo dopo passo mentre procedono a generare le risposte.

Ma nessuna di queste tecniche, spiega l’articolo del MIT, fermerà completamente le allucinazioni: finché i modelli linguistici di grandi dimensioni sono probabilistici ci sarà sempre un elemento di casualità in ciò che producono. Questo significa che nell’interazione con questi sistemi restano per il momento cruciali sia l’intervento umano, sia prevedere adeguate procedure di controllo degli output forniti per ridurre i rischi che le allucinazioni possono comportare, che variano a seconda delle mansioni demandate ai sistemi di AI.

Se con ChatGPT si rischia di produrre (e magari poi diffondere a terzi) contenuti con una percentuale più o meno elevata di errori, un’allucinazione in un sistema di guida autonoma di un veicolo può verosimilmente comportare un livello di rischio molto maggiore e mettere addirittura a repentaglio l’incolumità delle persone che interagiscono con quel sistema (guidatori, pedoni, guidatori di altri veicoli).   

Applicazioni dell’AI generativa

Sono molteplici le applicazioni dell’intelligenza artificiale generativa nel mondo business così come, di riflesso, nella vita quotidiana delle persone. L’Unione europea, nell’ambito dell’iniziativa “GenAI4EU”, definisce l’AI generativa come una “tecnologia di carattere generale accessibile, potente e adattabile a una vasta gamma di usi, dalla sanità alle città intelligenti fino alla meteorologia e agli impieghi in ambito spaziale e militare”.

L’intelligenza artificiale generativa, prosegue l’Ue, “ha le potenzialità per rivoluzionare l’interazione uomo-macchina e migliorare la produttività in tutte le catene del valore e le funzioni organizzative, gettando le basi per la creazione di nuove attività economiche”.

Il documento prosegue con un’analisi di tutti i settori industriali in cui l’AI generativa può trovare applicazione: robotica, assistenza sanitaria, ingegneria, mobilità, agricoltura, industria aerospaziale, farmaceutica e manifatturiera, biotecnologie e sostanze chimiche, cambiamento climatico e sostenibilità, settore pubblico.

Secondo la ricerca The economic potential of generative AI, frutto della collaborazione del McKinsey Global Institute e di QuantumBlack, la società di McKinsey specializzata in intelligenza artificiale, a beneficiare delle potenzialità offerte dall’intelligenza artificiale generativa sono soprattutto quattro funzioni aziendali chiave:

  • customer operations, ambito in cui ad esempio i chatbot basati sull’AI generativa migliorano l’esperienza dell’utente fornendo risposte intelligenti, contestualizzate e soprattutto personalizzate in base alle esigenze dei clienti;
  • marketing & vendite, dove di nuovo la personalizzazione garantita dall’AI generativa permette di migliorare la propria offerta, e dove l’apporto anche creativo dell’AI generativa consente di creare in poco tempo e con relativamente minori risorse efficaci campagne adv;   
  • software engineering, ambito in cui, ad esempio, l’AI generativa può essere utilizzata per generare codice automaticamente, semplificando i processi di sviluppo software e velocizzando la creazione di nuove applicazioni;
  • ricerca & sviluppo: l’AI generativa accelera la scoperta e l’innovazione, come ad esempio avviene in campo farmaceutico, con aziende che usano modelli di AI per generare nuove molecole per farmaci, riducendo significativamente i tempi e i costi associati alla ricerca.

In un contesto aziendale l’AI generativa può essere utilizzata come supporto e potenziamento nella generazione di nuove idee e anche per la gestione della knowledge base aziendale. In questo senso le aziende con un grado più elevato di adoption stanno iniziando a sperimentare modelli di AI generativa organizzati in base alla propria knowledge base, che possono semplificare e velocizzare la produzione di report, presentazioni e in generale documenti basati su tutto quello che è il patrimonio di conoscenze sedimentato e condiviso all’interno dell’organizzazione.

L’AI generativa può trovare applicazioni anche in contesti meno cruciali. Per fare un ultimo esempio, citiamo un recente articolo della MIT Technology Review dal titolo How generative AI could reinvent what it means to play, che si sofferma su come questa tecnologia potrebbe rivoluzionare il settore dei videogame nel prossimo futuro, grazie alla possibilità di dare vita a tipi di interazioni di gioco completamente nuovi, aperti, creativi e inaspettati, potenzialmente senza fine.

Conclusioni

L’intelligenza artificiale generativa o Gen AI non è solo una tendenza tecnologica, ma una forza motrice che sta plasmando il presente e il futuro di persone, aziende, interi settori industriali e istituzioni, rivoluzionando il modo in cui lavoriamo, viviamo il nostro tempo libero, ci interfacciamo con servizi o pubbliche amministrazioni.

Comprendere i concetti fondamentali alla base del suo funzionamento e le sue applicazioni può fornire un vantaggio competitivo significativo in qualsiasi settore e migliorare l’adoption di questa tecnologia.

Per capire come l’adoption dell’AI generativa può portare benefici ad aziende di ogni tipo di industry potete contattare Logotel, Independent design company certificata Microsoft Solutions Partner for Modern Work con specializzazione in Adoption e Change management.