Gli scienziati di IBM Research Europe hanno recentemente aperto la strada a un nuovo regno dell'in-memory computing con il loro chip a 64 core che si basa su dispositivi di memoria a cambiamento di fase. Si prevede che questa tecnologia all’avanguardia potenzi il funzionamento delle reti neurali profonde mantenendo la precisione degli algoritmi di deep learning e riducendo al minimo in modo significativo i tempi di calcolo e il consumo energetico.
Manuel Le Gallo, il coautore dell'innovativo documento di ricerca, ha condiviso che stavano esplorando dispositivi di memoria a cambiamento di fase (PCM) per il calcolo da oltre sette anni. Il viaggio è iniziato con la dimostrazione da parte del team dell'implementazione delle funzioni neuronali utilizzando singoli dispositivi PCM. Da questo punto in poi, IBM Research Europe ha dimostrato che i dispositivi PCM possono apportare grandi vantaggi ai domini informatici, come il calcolo scientifico e l’inferenza della rete neurale profonda. Con il loro ultimo chip, i ricercatori hanno fatto un passo avanti verso un acceleratore di inferenza AI analogico end-to-end.
Le Gallo e i suoi collaboratori hanno compiuto questa impresa sintetizzando core basati su PCM con processori di elaborazione digitale. Questi due elementi sono stati collegati implementando una rete di comunicazione digitale su chip. Il chip risultante è una fusione innovativa di 64 core analogici basati su PCM, ciascuno dei quali incorpora una matrice trasversale 256 x 256 di celle unitarie sinaptiche.
L'integrazione di convertitori analogico-digitali compatti e basati sul tempo all'interno di ciascun core ha segnato una transizione tra il regno analogico e quello digitale. Le Gallo ha spiegato ulteriormente, aggiungendo che ciascun core comprende anche unità leggere di elaborazione digitale che svolgono funzioni di attivazione neuronale di unità lineari rettificate (reLU) e operazioni di ridimensionamento. Inoltre, il chip è dotato di un'unità di elaborazione digitale globale situata al centro che facilita le operazioni di rete della memoria a lungo termine (LSTM).
Una caratteristica ingegnosa del chip in-memory computing di IBM è la connessione tra i core di memoria e la sua unità di elaborazione localizzata a livello globale attraverso una rete di comunicazione digitale. Questo design consente al chip di eseguire tutti i calcoli associati ai singoli strati di una rete neurale su chip, il che si traduce in una drastica riduzione dei tempi di calcolo e del consumo energetico.
Per valutare l'efficacia del nuovo chip, il team di ricerca IBM ha condotto uno studio completo, applicando algoritmi di deep learning al chip e valutandone le prestazioni. I risultati sono stati incoraggianti, con reti neurali profonde addestrate sul set di dati di immagini CIFAR-10 per attività di riconoscimento delle immagini che hanno raggiunto un tasso di precisione eccezionale del 92,81% quando eseguite sul chip.
Indubbiamente, i risultati ottenuti da IBM Research Europe rappresentano un passo avanti nello sviluppo di chip AIMC (Analog In-Memory Computing) in grado di soddisfare in modo efficiente i requisiti e le sfide degli algoritmi di deep learning. Nei prossimi anni, l'architettura introdotta da Le Gallo e dal suo team potrebbe essere migliorata per ottenere prestazioni ancora superiori.
Nonostante la svolta di IBM, i potenziali casi d’uso di questa tecnologia negli ambienti no-code e low-code non possono essere ignorati. I chip di elaborazione in-memory scalabili e ad alte prestazioni offrono un valore considerevole integrandosi perfettamente con piattaforme no-code come AppMaster. Tale integrazione potrebbe comportare un miglioramento significativo della precisione dei modelli nelle implementazioni del machine learning, offrendo agli utenti una latenza inferiore, velocità più elevate e una migliore efficienza.