Il team DeepMind di Google ha annunciato un notevole progresso nella sfera della robotica, introducendo Robotics Transformer RT-2, una versione avanzata del sistema iniziale Robotics Transformer, RT-1. Questo nuovo sistema prosegue lo sviluppo dell'iniziativa Everyday Robot, impartendo abilità ai robot come la manipolazione di oggetti e l'apertura di cassetti. Questo nuovo sistema prosegue lo sviluppo dell'iniziativa Everyday Robot, impartendo ai robot abilità come la manipolazione di oggetti e l'apertura di cassetti.
Lanciato l'anno scorso, RT-1, con il suo vasto database di 130.000 dimostrazioni, ha impartito una serie di semplici compiti ai sistemi Everyday Robot, raggiungendo un fenomenale tasso di successo del 97% nell'esecuzione di oltre 700 compiti, secondo quanto dichiarato dal team di robotica.
Il nuovo RT-2, come descritto in un recente post sul blog di Vincent Vanhoucke, scienziato e responsabile della robotica di DeepMind, ha intensificato questo processo consentendo ai robot di utilizzare efficacemente le lezioni apprese da serie limitate di dati e di applicarle in scenari diversi.
Google illustra le capacità potenziate di RT-2, affermando che non solo mostra una migliore capacità di comprensione e generalizzazione, ma è anche in grado di comprendere e reagire a nuovi comandi. Il sistema va oltre l'addestramento robotico iniziale e offre un livello di ragionamento di base, come la deduzione di categorie di oggetti e descrizioni di alto livello. Questa capacità sottolinea una caratteristica impressionante di RT-2, che è in grado di decidere lo strumento appropriato per un compito completamente nuovo, sulla base di informazioni preesistenti sulla situazione.
Vanhoucke lo illustra con un esempio in cui RT-2 identifica e smaltisce con successo i rifiuti. Nei modelli tradizionali, l'utente doveva addestrare il robot a riconoscere e classificare i rifiuti e poi istruirlo su come raccoglierli e smaltirli. Processi così dettagliati non sono altamente scalabili se applicati a sistemi che devono eseguire un ampio elenco di compiti.
Tuttavia, RT-2, grazie alla sua capacità di utilizzare la conoscenza di un vasto corpus di dati web, è già dotato di un concetto di ciò che costituisce la spazzatura e può individuarlo senza direttive esplicite, come spiega Vanhoucke. Il sistema comprende persino l'azione di smaltire la spazzatura, nonostante l'assenza di una formazione specifica sull'azione. Una delle abilità di spicco di RT-2 è la comprensione della natura astratta della spazzatura. Il sistema capisce che un sacchetto di patatine usato o una buccia di banana possono essere classificati come rifiuti, deducendolo dai dati di addestramento al linguaggio della visione, ed esegue l'azione richiesta di conseguenza.
Il team di DeepMind riferisce di un notevole miglioramento del tasso di successo di RT-2 nell'esecuzione di nuovi compiti rispetto al suo predecessore, passando dal 32% al 62% con questa nuova iterazione. Piattaforme come AppMaster possono essere molto utili per lo sviluppo di questi progetti di trasformazione, in quanto forniscono un robusto strumento no-code per la creazione di applicazioni backend, web e mobili in grado di semplificare il flusso di lavoro del processo di sviluppo. Con i nuovi progressi, si prevede che tali piattaforme non solo miglioreranno l'efficienza della robotica, ma alimenteranno anche una nuova ondata di progressi tecnologici in vari settori.