L’UE lancia OpenEuroLLM per rafforzare la sovranità digitale dell’Europa

| 18/02/2025
L’UE lancia OpenEuroLLM per rafforzare la sovranità digitale dell’Europa

Un programma ambizioso che ha lo scopo di sviluppare una serie di modelli linguistici di grandi dimensioni (LLMs) open source su supercomputer europei. Con un budget iniziale di 37,4 milioni di euro si inserisce in un contesto di crescenti investimenti europei in infrastrutture digitali e intelligenza artificiale, ma solleva interrogativi sulla sua fattibilità e sull’effettiva apertura dei dati utilizzati.

L’Europa ha fatto un passo significativo verso la sovranità digitale con l’annuncio, lo scorso 3 febbraio, di OpenEuroLLM, un programma per sviluppare modelli linguistici di grandi dimensioni (LLMs) open source. Questo progetto copre le 24 lingue ufficiali dell’Unione Europea, oltre a quelle dei paesi in fase di negoziazione per l’ingresso nel mercato UE, come l’Albania.
Il progetto è guidato da Jan Hajič, linguista computazionale della Charles University di Praga, e Peter Sarlin, CEO del laboratorio finlandese di intelligenza artificiale Silo AI.

L’iniziativa OpenEuroLLM si inserisce in una narrativa più ampia che vede l’Europa spingere per la sovranità digitale, portando infrastrutture critiche più vicine al Continente.
Molte aziende del cloud stanno investendo in infrastrutture locali per garantire che i dati UE rimangano in Europa.
Parallelamente, l’UE ha recentemente firmato un accordo da 11 miliardi di dollari per creare una costellazione di satelliti sovrani, in competizione con Starlink di Elon Musk.

OpenEuroLLM sta lavorando a quella che sarà la prima famiglia di Large Language Models open-source che coprirà tutte le lingue ufficiali e future dell’UE. Il progetto intende addestrare questi modelli di intelligenza artificiale sui supercomputer europei, nel rispetto dei valori di trasparenza, apertura e accessibilità, in conformità con l’AI Act.

OpenEuroLLM, un budget di 37,4 milioni di euro

Il consorzio ha iniziato il suo lavoro il 1° febbraio 2025, con il finanziamento della Commissione Europea. Nonostante l’ambizione, il budget di 37,4 milioni di euro (di cui 20,6 milioni di euro provengono dal Programma Europa Digitale) sembra esiguo rispetto agli investimenti delle grandi aziende di IA. Inoltre, la partecipazione di oltre 20 organizzazioni solleva dubbi sulla capacità del consorzio di mantenere un focus chiaro. Anastasia Stasenko, co-fondatrice della società LLM Pleias, ha evidenziato come i successi recenti dell’IA in Europa siano stati ottenuti da piccoli team focalizzati.
Il progetto OpenEuroLLM non parte completamente da zero, grazie all’esperienza accumulata con il progetto High Performance Language Technologies (HPLT). Hajič prevede che le prime versioni dei modelli saranno rilasciate entro la metà del 2026, con la conclusione del progetto prevista per il 2028. Tuttavia, la mancanza di un profilo GitHub dettagliato lascia alcuni dubbi sulla concretezza dei progressi.

OpenEuroLLM, partecipazioni e collaborazioni

Il progetto coinvolge organizzazioni accademiche e di ricerca da paesi come Repubblica Ceca, Paesi Bassi, Germania, Svezia, Finlandia e Norvegia, oltre ai centri EuroHPC.

Università ed enti di ricerca

Aziende:

Centri EuroHPC:

Da notare l’assenza di Mistral, importante startup francese di IA open source.

Progetti sviluppati all’interno del quadro normativo europeo

Il progetto OpenEuroLLM è in linea con l’imperativo di migliorare la competitività e la sovranità digitale dell’Europa. Il progetto è un ottimo esempio del tipo di infrastruttura tecnologica necessaria per abbassare le soglie di sviluppo e perfezionamento dei prodotti europei di intelligenza artificiale, dimostrando la forza della trasparenza, dell’apertura e del coinvolgimento della comunità, valori ampiamente riconosciuti nell’ecosistema tecnologico europeo.
I modelli saranno sviluppati all’interno del quadro normativo europeo, garantendo l’allineamento con i valori europei e mantenendo l’eccellenza tecnologica. In collaborazione con le comunità open-source e open science come LAION, open-sci e OpenML, e con altri esperti del settore riuniti nell’Open Strategic Partnership Board del progetto, OpenEuroLLM garantirà che i modelli, il software, i dati e la valutazione siano completamente aperti e possano essere perfezionati e messi a punto per le specifiche esigenze dell’industria e del settore pubblico.
Questi modelli multilingue performanti preservano la diversità linguistica e culturale, consentendo alle aziende europee di sviluppare prodotti e servizi di alta qualità nell’era dell’IA.
Il progetto, che ha ottenuto il sigillo STEP (Strategic Technologies for Europe Platform), si avvale del sostegno di precedenti progetti europei e dell’esperienza dei partner e dei loro risultati, tra cui grandi archivi di dati di alta qualità e LLM pilota sviluppati in precedenza

Sfide nell’apertura dei dati

OpenEuroLLM si trova ad affrontare la sfida di bilanciare l’apertura dei dati con le esigenze di qualità. Sebbene l’obiettivo sia rendere tutto open source, alcune limitazioni legate ai diritti d’autore europei potrebbero impedire la redistribuzione di parte dei dati di addestramento. Tuttavia, i dati potrebbero essere resi disponibili per ispezioni su richiesta, come richiesto dall’AI Act dell’UE.
Nonostante le sfide, OpenEuroLLM rappresenta un passo importante verso la sovranità digitale europea. Anche se il progetto non dovesse produrre il miglior modello al mondo, sarebbe importante che l’Europa sviluppasse un modello con componenti basati nel Continente. Ciò rappresenterebbe comunque un risultato positivo per la sovranità digitale europea.

Barberio & Partners s.r.l.

Via Donatello 67/D - 00196 Roma
P.IVA 16376771008

Policy
Privacy Policy
Cookie Policy
Termini e Condizioni
iscriviti alla nostra newsletter
Questo sito è protetto da reCAPTCHA e la Informativa sulla Privacy di Google, nonché i Termini di Servizio sono applicabili.