Seeweb e DHH lanciano un acceleratore di Intelligenza Artificiale che consente di gestire in particolar modo le fasi di inferenza abbattendo i costi, senza rinunciare alle prestazioni elevate che richiede l’AI e garantendo un’elevata scalabilità, e quindi prestazioni flessibili e adattive. L’AI Accelerator sfrutta infatti la tecnologia avanzata di una start-up canadese, Tenstorrent. Utilizza in particolare le NPU (Neural Processing Unit) messe a punto da Tenstorrent, che necessitano di un quantitativo di memoria ridotto e si prestano estremamente bene per lo sviluppo di Small Language Model o SML. Le NPU con cui è stato possibile per la compagnia italiana leader nelle infrastrutture cloud per IA e ML costruire il nuovo “AI Accelerator” hanno un costo e un consumo energetico – e quindi anche un impatto ambientale – notevolmente più contenuti rispetto alle canoniche GPU, su cui Seeweb ha già da tempo costruito un’offerta cloud competitiva. La soluzione messa a punto da Seeweb può essere impiegata in maniera efficace anche nella fase di addestramento, ma dà il suo meglio quando viene utilizzata per il “light machine learning” e per i modelli piccoli, soprattutto in fase di inferenza. Si tratta del processo in cui un modello di IA già addestrato genera un contenuto nuovo elaborando dei dati che non aveva acquisito in precedenza. Grazie a queste caratteristiche, l’acceleratore è in grado di fornire un’elevata capacità di elaborazione AI per gestire attività complesse basate sui dati.
Le NPU sono in grado di gestire in maniera efficace l’esecuzione simultanea dei processi di calcolo. Sono quindi uno strumento di accelerazione essenziale per le reti neurali. Queste ultime, infatti, analizzano immagini di continuo, da cui estrapolano caratteristiche e creano associazioni, per generare poi un contenuto nuovo.
Seeweb sta seguendo con particolare interesse questa nuova generazione di chip che oggi rappresenta una delle evoluzioni tecnologiche più promettenti per favorire lo sviluppo full-stack di applicativi AI e ML. Questa analisi costante è fondamentale per soddisfare le esigenze delle aziende e del mondo della Ricerca con una varietà di server e di schede adatte alle diverse esigenze e ai vari casi d’uso.
“L’accordo con la canadese Tenstorrent – commenta Antonio Baldassarra, Ceo di Seeweb, – e la commercializzazione del primo servizio Cloud Server NPU con i loro chip è per noi un importante risultato, sia perché riteniamo che ci sarà sempre più spazio per chip specializzati con funzioni verticali nell’ambito delle infrastrutture per l’intelligenza artificiale, sia perché i chip Tenstorrent sono basati sull’architettura aperta RISC-V, che potrebbe tracciare un nuovo futuro”.