L’economista Cecilia Rikap analizza l’irruzione della start-up cinese DeepSeek nel settore dell’intelligenza artificiale, il suo recente impatto sui mercati finanziari e le questioni di sovranità digitale che solleva.
600 miliardi di dollari. È il crollo della capitalizzazione di mercato di Nvidia lunedì 26 gennaio. Durante il fine settimana precedente, l’applicazione di intelligenza artificiale (IA) della start-up cinese DeepSeek era diventata l’applicazione gratuita più scaricata negli Stati Uniti. La capitalizzazione di mercato di Nvidia non è stata l’unica a crollare quel lunedì a causa di questa novità cinese. Tutte le principali aziende tecnologiche americane hanno subito forti cali, anche se meno spettacolari, con una perdita totale di oltre mille miliardi di dollari in un solo giorno.
Questa reazione eccessiva del mercato azionario, in parte corretta nei giorni successivi, non è dovuta al fatto che il modello R1 di DeepSeek sia migliore dei modelli esistenti. In realtà, R1 non presenta differenze significative rispetto ad altri modelli di IA generativa all’avanguardia, in particolare ChatGPT. Ma il fatto che un modello cinese sia considerato altrettanto performante di ChatGPT e degli altri modelli americani è senza dubbio una novità importante. È anche una ragione geopolitica sufficiente a far vacillare il valore di borsa delle più grandi aziende americane, che sono anche le più grandi del mondo.
Tuttavia, il fatto che DeepSeek sia cinese è solo una parte della spiegazione. Il vero motivo per cui non solo la borsa, ma anche Trump e l’intero sistema globale di sviluppo dell’IA generativa dominato dagli Stati Uniti, sono stati scossi è che DeepSeek R1 è stato molto meno costoso da produrre e, per di più, è parzialmente accessibile in open source, consentendo ad altri di scaricarlo e utilizzarlo per sviluppare le proprie applicazioni. Inoltre, viene offerto a un costo inferiore rispetto al modello Llama di Meta, anch’esso ad accesso semi-aperto, quando viene utilizzato tramite i servizi cloud di altri giganti della tecnologia.
Un’IA a basso costo
DeepSeek R1 è più economico da tutti i punti di vista. È il primo modello all’avanguardia che ha richiesto per il suo addestramento una frazione della potenza di calcolo – e quindi dei costi – utilizzata dagli altri modelli di alto livello.
La start-up cinese ha utilizzato una tecnica di apprendimento per i modelli di IA chiamata distillazione di conoscenza. In questo contesto, la distillazione consiste nell’estrarre automaticamente la conoscenza da modelli preesistenti. Grazie a questa base, il tempo di addestramento rimanente è più breve e ogni ciclo di addestramento richiede meno investimenti, poiché il punto di partenza è molto migliore rispetto a partire da zero.
L’innovazione non risiede nel metodo in sé, poiché questa tecnica era già stata utilizzata in precedenza. Tuttavia, fino ad ora produceva solo modelli più piccoli e meno performanti degli originali. DeepSeek, pur avendo un numero ridotto di parametri (il che lo rende anche più economico da usare), riesce a competere con i modelli più avanzati.
Sebbene sia impossibile stabilire un confronto diretto con i costi di addestramento di modelli come GPT di OpenAI o Llama di Meta – dato che dovremmo conoscere i costi totali di produzione di DeepSeek R1, un’informazione tenuta segreta – è evidente che DeepSeek produce IA a basso costo. L’ultima fase di addestramento ha richiesto solo 5,6 milioni di dollari. È qui che la start-up cinese mette in discussione il paradigma dello sviluppo dell’IA generativa imposto dai giganti tecnologici americani.
Chi perde e chi vince (ancora)?
Scoprire che è possibile sviluppare modelli all’avanguardia senza accumulare una quantità colossale di semiconduttori di IA di ultima generazione e volumi di dati altrettanto giganteschi mette in pericolo il modello economico di Nvidia, un’azienda quasi interamente dedicata alla progettazione di questi chip elettronici. Da qui il crollo della sua capitalizzazione di mercato.
D’altra parte, il crollo delle azioni di Amazon, Microsoft e Google non significa la fine del loro dominio. Al contrario. Il loro modello di business non si basa principalmente sulla vendita di modelli di IA – sebbene ne sviluppino e commercializzino anche – ma su il cloud. In altre parole, il mercato in cui questi modelli e altre tecnologie vengono sviluppati, utilizzati e venduti. Queste aziende beneficiano della continua espansione dell’adozione dell’IA, che sta ancora accelerando con l’arrivo di DeepSeek.
Il cloud funziona come una sorta di spazio di co-working o di fabbrica virtuale in cui i servizi digitali vengono prodotti e consumati grazie ai dati caricati. In un contesto di sfiducia nei confronti della Cina, è poco probabile che le aziende e i governi adottino DeepSeek per elaborare i propri dati. D’altra parte, il fatto che gli utenti lo adottino gratuitamente, compresi migliaia di sviluppatori che cercano di migliorare il proprio codice o creare applicazioni, rappresenta un mercato molto diverso dall’adozione dell’IA nel cloud come servizio personalizzato per aziende e Stati.
In questo contesto, la dipendenza delle start-up occidentali di IA – dalle americane OpenAI e Anthropic alla francese Mistral – dai giganti del cloud si sta accentuando. Se prima era già difficile per queste aziende operare al di fuori del cloud di Amazon, Microsoft o Google, ora diventa impossibile. Questi giganti non sono solo i principali investitori in capitale di rischio delle start-up occidentali nel campo dell’IA generativa, ma le loro infrastrutture cloud concentrano anche la crescente domanda di aziende, governi e università che pagano per l’IA.
Per OpenAI e gli altri, staccarsi significherebbe perdere l’accesso a questo ecosistema di servizi. In realtà, la loro principale differenza rispetto a DeepSeek risiede nella loro perfetta integrazione con questo ecosistema. Far parte del cloud garantisce che i servizi di una start-up si integrino perfettamente con quelli già utilizzati dai clienti del cloud.
Questa compatibilità è il risultato del controllo esercitato da Amazon, Microsoft e Google su tutte le start-up dei loro ecosistemi, costringendole a pagare una sorta di tassa privata per offrire servizi sulle loro piattaforme. Oggi più che mai, sviluppare modelli senza la protezione di questi giganti della tecnologia – e soprattutto utilizzando metodi di sviluppo più costosi che partono da zero, a differenza di DeepSeek – non rappresenta un modello economico sostenibile.
Il quadro geopolitico del digitale
Nel frattempo, OpenAI accusa la start-up cinese di aver utilizzato i suoi modelli, protetti da diritti di proprietà intellettuale, per acquisire le conoscenze necessarie allo sviluppo di DeepSeek R1. Ma come dice il proverbio, chi ruba a un ladro non è perdonato per cento anni: non dimentichiamo che OpenAI ha addestrato i suoi modelli linguistici con milioni di documenti protetti da copyright. Tuttavia, Trump non perdonerà certamente DeepSeek. Infatti, a partire dall’amministrazione Obama, una tendenza costante è che, man mano che il vantaggio degli Stati Uniti sulla Cina si riduce, aumenta la pressione americana sul resto del mondo per bloccare la Cina.
Gli Stati Uniti hanno cercato di ostacolare lo sviluppo tecnologico cinese nel campo dell’IA vietando alle aziende americane, e a quelle che desiderano commerciare con gli Stati Uniti, di vendere a Pechino componenti chiave della catena del valore dei semiconduttori, compresi i chip stessi. Ma prima che questa politica entrasse in vigore, la Cina ha costituito scorte di semiconduttori per l’IA, una strategia seguita anche dal titolare del fondo di investimento che finanzia DeepSeek. E sebbene la quantità di semiconduttori non fosse sufficiente per seguire il paradigma in vigore e che questi non fossero più i semiconduttori più avanzati sul mercato, la start-up ha trovato un modo per ottenere risultati con i semiconduttori di cui disponeva.
Una domanda rimane aperta: come reagiranno gli Stati Uniti? Uno scenario probabile è un rafforzamento dei controlli sull’adozione delle tecnologie cinesi nel mondo, e che DeepSeek subisca lo stesso destino di Huawei con il 5G. Quest’ultima è stata la prima a sviluppare la tecnologia, ma il governo americano ha bloccato uno dopo l’altro i suoi contratti in Occidente, dando così ai suoi rivali il tempo di imitare la tecnologia e limitare la crescita del gigante cinese delle telecomunicazioni.
Sovranità digitale
Qualunque sia l’esito della rivalità tra le due potenze globali, l’emergere di DeepSeek R1 offre l’opportunità di sviluppare un’IA pubblica da parte dei paesi non allineati, al di fuori dei modelli dominanti di controllo e concentrazione, sia americani che cinesi. La possibilità di creare modelli all’avanguardia a costi inferiori apre la strada a un progetto internazionale di sviluppo tecnologico che mette in primo piano le esigenze sociali e i vincoli ecologici. L’importanza centrale di queste tecnologie in tutti i settori della vita richiede una soluzione pubblica e comune, che venga utilizzata, ad esempio, da scuole, ospedali e altre istituzioni pubbliche.
Lo sviluppo di modelli di IA pubblici favorisce anche il loro controllo democratico. Oggi l’IA è sviluppata in un’ottica di redditività. Senza un intervento pubblico per creare modelli aperti e controllati, rischiamo di vedere un aumento delle applicazioni che vanno dal controllo e dalla sorveglianza alle tecnologie che sostituiscono la creatività umana invece di arricchire l’esperienza lavorativa.
Ogni giorno assistiamo alle conseguenze della perdita di spazi di deliberazione pubblica su Internet. I social network funzionano con algoritmi di IA che determinano quali messaggi vengono visualizzati, dove e quando, e quali no. In questo modo, una manciata di aziende influenzano la percezione collettiva e l’opinione pubblica. È imperativo che ciò non si ripeta nell’adozione dell’IA da parte degli Stati. Adottando le tecniche di distillazione utilizzate da DeepSeek, diventa economicamente possibile sviluppare un’IA pubblica, aperta e verificabile per lo Stato, la sanità e l’istruzione pubblica.
*Questo testo è stato pubblicato per la prima volta in spagnolo per la rivista latino-americana Nueva sociedad.