Sintesi del progetto
SIREN ha esplorato soluzioni per accelerare l’inferenza IA utilizzando architetture disaggregate e basate su RISC-V, con l’obiettivo di unire prestazioni elevate ed efficienza energetica. Il progetto parte dal confronto con acceleratori affermati e verifica come sistemi modulari possano mantenere livelli di performance paragonabili, offrendo maggiore flessibilità nella configurazione delle infrastrutture hardware.
Obiettivi
Validare piattaforme di calcolo ad alte prestazioni compatibili con l’ecosistema RISC- V, studiare il comportamento degli acceleratori in scenari reali di inferenza e addestramento, documentare limiti e potenzialità delle configurazioni disaggregate per l’esecuzione di modelli di Deep e Machine Learning.
Problemi e necessità
Il crescente uso di Intelligenza Artificiale richiede soluzioni meno costose e più efficienti delle infrastrutture tradizionali. Molte organizzazioni non dispongono delle risorse per sistemi completi, mentre l’adozione di configurazioni modulari permette di ridurre costi iniziali e complessità, mantenendo il livello prestazionale richiesto dalle applicazioni avanzate.
Soluzioni sviluppate
Il progetto ha dimostrato che l’inferenza e il training possono raggiungere prestazioni comparabili a quelle di sistemi integrati grazie all’uso di acceleratori disaggregati. Sono stati documentati i passaggi necessari per rendere la piattaforma pienamente operativa, dall’analisi dei driver alla gestione termica, fino all’individuazione e risoluzione dei guasti a basso livello.
Benefici e ricadute
La modularità consente di ridurre i costi dei componenti e della manutenzione, limitare i consumi energetici e rendere l’infrastruttura IA più accessibile. Questo approccio permette di creare sistemi scalabili, adattabili alle esigenze di enti pubblici, aziende e istituti di ricerca che devono gestire carichi di lavoro di inferenza senza investimenti elevati.
Settori che possono beneficiare
Le ricadute riguardano soprattutto per l’Intelligenza Artificiale, Software e il Calcolo e Infrastrutture di Storage, con potenziali benefici per l’Industria, la Mobilità, le Smart Cities e altri domini che richiedono capacità di analisi distribuita e infrastrutture IA più sostenibili.