14 giu 2023·1 min di lettura

OctoML presenta OctoAI: un servizio di calcolo AI auto-ottimizzante

OctoML annuncia il lancio della sua nuova piattaforma, OctoAI, un servizio di calcolo auto-ottimizzante per l'IA, progettato per facilitare l'implementazione di applicazioni basate su ML, dall'ottimizzazione dei modelli alla selezione dell'hardware migliore, garantendo al contempo facilità d'uso e attenzione all'IA generativa.

OctoML presenta OctoAI: un servizio di calcolo AI auto-ottimizzante

Dal lancio nel 2019 come strumento di ottimizzazione dei modelli di ML, alla raccolta di 132 milioni di dollari e all'aggiunta di diverse funzionalità per l'implementazione dei modelli di ML, OctoML si è posizionata come un attore significativo nel campo dell'apprendimento automatico. L'azienda sta ora lanciando OctoAI, spostando l'attenzione dalla mera ottimizzazione dei modelli alla possibilità per le aziende di perfezionare i propri modelli di ML utilizzando modelli open-source, i propri dati o modelli personalizzati. OctoAI è un servizio di calcolo AI auto-ottimizzante che si rivolge all'AI generativa, semplificando la gestione dell'infrastruttura e consentendo alle aziende di concentrarsi sulla creazione di applicazioni basate sulla ML.

Luis Ceze, cofondatore e CEO di OctoML, ha dichiarato che la precedente piattaforma poneva l'accento sugli ingegneri di ML, semplificando il confezionamento dei modelli e la loro distribuzione su diversi tipi di hardware. Tuttavia, l'ultima versione permetterà agli utenti di decidere a cosa dare priorità, come la latenza o il costo, e OctoAI determinerà automaticamente l'hardware ideale per il compito. La nuova piattaforma ottimizza inoltre autonomamente i modelli, aumentando le prestazioni e l'efficienza dei costi.

Anche se gli utenti possono ancora scegliere i parametri di esecuzione e controllo dell'hardware che preferiscono, Ceze prevede che la maggior parte degli utenti preferirà la gestione automatizzata di OctoAI. Il servizio può decidere se eseguire i modelli di ML sulle GPU di Nvidia o sulle macchine Inferentia di AWS. Questo elimina molte complessità legate all'implementazione dei modelli di ML e risolve gli ostacoli che hanno impedito molti progetti di ML.

OctoML offre versioni accelerate dei più diffusi modelli di base, tra cui Dolly 2, Whisper, FILM, FLAN-UL2 e Stable Diffusion, con l'intenzione di includere altri modelli. Durante i loro test, hanno visto Stable Diffusion funzionare tre volte più velocemente e ridurre i costi di cinque volte rispetto al modello originale.

Anche se OctoML continuerà a lavorare con i clienti esistenti che utilizzano il servizio per ottimizzare i loro modelli, l'azienda si concentrerà in futuro su OctoAI come nuova piattaforma di calcolo. La semplificazione dei processi di implementazione del ML rende piattaforme come OctoAI e le soluzioni low-code e no-code di AppMaster strumenti importanti per le aziende che vogliono sfruttare la potenza dell'AI e del ML, senza dover gestire infrastrutture complesse.

Easy to start
Create something amazing

Experiment with AppMaster with free plan.
When you will be ready you can choose the proper subscription.

Get Started