Il supercomputer Franklin dell’Istituto italiano di tecnologia è stato potenziato per accompagnare l’evoluzione degli studi e dei ricercatori dell’Iit. Il progetto è stato sviluppato in collaborazione con E4 Computer Engineering, azienda reggiana operativa nel settore delle soluzioni hardware e software ad altissimo contenuto tecnologico per cluster HPC, cloud, data analytics, intelligenza artificiale e hyper-converged infrastructure per i mercati academic ed enterprise.
Fondato nel 2003, con 14 centri di ricerca, più di 1300 brevetti all’attivo e 35 startup generate, l’Iit si è evoluto nel corso degli anni, vedendo parallelamente crescere le proprie esigenze in termini di infrastrutture digitali e capacità di calcolo.
Per questo, nel 2020, E4 aveva realizzato – a partire dalla progettazione del datacenter per l’Istituto – il supercomputer Franklin, dotato di capacità computazionale di 1 PFlops e gestito utilizzando i paradigmi classici dell’HPC, dalla gestione dell’infrastruttura (ogni nodo destinato sostanzialmente a una missione) alla user experience dei ricercatori basata su interfaccia testuale e sottomissione di job in batch.
Tuttavia, le attuali necessità dell’HPC moderno e della ricerca data driven rendono il solo accesso in modalità batch troppo limitato, mentre l’estrema complessità e diversità degli strumenti usati in diverse linee di ricerca non permettono di avere una gestione dei nodi di calcolo troppo statica.
Per queste ragioni, l’attuale upgrade realizzato da E4 è incentrato su due aspetti: da un lato il potenziamento dell’infrastruttura secondo criteri di sostenibilità (accrescendo del 50% la potenza computazionale di Franklin a fronte di un aumento del 10% dell’hardware) dall’altro l’adozione di nuovi approcci per la gestione dell’infrastruttura e per l’accesso alle risorse.
La soluzione Medooza di E4 per l’HPC, infatti, prevede di gestire un cluster secondo i paradigmi del cloud e dell’Infrastructure as a Code, garantendo la capacità di riconfigurare rapidamente on demand e la riproducibilità delle configurazioni stesse.
All’interno di Medooza, la componente ICE4HPC di E4 permette di far coesistere sulla stessa infrastruttura calcoli in modalità batch e in modalità interattiva, basati sull’uso di notebook e di interfacce browser, ed in particolare l’accesso alle risorse GPU in modalità interattiva e condivisa.
A differenza dell’HPC tradizionale, per le linee di ricerca data driven l’accesso alle risorse in modalità interattiva è un requisito fondamentale.
Calcolo interattivo e visualizzazione sono aspetti critici per la ricerca in ambito Artificial Intelligence e proprio l’interazione tra metodi AI e simulazioni fisiche tradizionali sono al centro degli studi più avanzati portati avanti tramite le risorse e le modalità di interazione messe a disposizione da Franklin.
A seguito degli interventi di upgrade, il cluster Franklin è stato dunque significativamente ottimizzato e ha raggiunto un dimensionamento utile agli scopi dell’istituto, consentendone l’utilizzo da parte di una notevole quantità di linee di ricerca e con oltre 250 utenti attivi.
“Questo nuovo capitolo della nostra collaborazione con Iit, iniziata nel 2008 e consolidatasi nel corso degli anni attraverso passaggi fondamentali come la prima realizzazione del cluster Franklin, è per noi motivo di particolare orgoglio perché conferma la nostra capacità, progettuale e di know-how, di accompagnare un ente prestigioso e di rilevanza nazionale nel suo percorso evolutivo di utilizzo del supercomputing al servizio dell’innovazione e della ricerca”, ha commentato Cosimo Damiano Gianfreda, ceo di E4 Computer Engineering.
“Nel corso del tempo si è compreso come l’HPC non fosse un asset soltanto di nicchia, per esempio ristretto alla simulazione atomistica, ma al contrario un fattore abilitante del tutto trasversale. Si è quindi realizzata una infrastruttura a disposizione di tutta la comunità scientifica di Iit per abilitare e accelerare la scoperta in tutti i domini computazionali dell’istituto”, ha sottolineato Sergio Decherchi, coordinatore della Facility di Data Science and Computation.
Il cluster Franklin viene gestito da Dscf, che mette a disposizione la potenza di calcolo del supercomputer all’intero Istituto permettendo un impiego massiccio di tecniche di machine learning e analisi dati che hanno la necessità di accedere a risorse preziose quali proprio le GPU.