Een opmerkelijke vooruitgang op het gebied van robotica is aangekondigd door het DeepMind-team van Google, met de introductie van Robotics Transformer RT-2, een geavanceerde versie van hun eerste Robotics Transformer-systeem, RT-1. Dit nieuwe systeem zet de ontwikkeling van het Everyday Robot-initiatief voort, waarbij robots vaardigheden aanleren zoals het hanteren van voorwerpen en het openen van laden. Dit nieuwe systeem gaat verder met de ontwikkeling van het Everyday Robot initiatief, waarbij robots vaardigheden aanleren zoals het hanteren van objecten en het openen van lades.
De RT-1, die vorig jaar werd gelanceerd, met zijn uitgebreide database van 130.000 demonstraties, voerde een reeks eenvoudige taken uit voor Everyday Robot-systemen en behaalde een fenomenaal succespercentage van 97% bij het uitvoeren van meer dan 700 taken, aldus het roboticateam.
De onlangs onthulde RT-2, zoals beschreven in een recente blogpost van DeepMind's Distinguished Scientist en Hoofd Robotica, Vincent Vanhoucke, heeft dit proces geëscaleerd door robots in staat te stellen effectief gebruik te maken van lessen die zijn geleerd uit beperkte datasets, en deze toe te passen in diverse scenario's.
Google licht de verbeterde capaciteiten van RT-2 toe door te stellen dat het niet alleen een beter begrip en betere generalisatievaardigheden heeft, maar ook nieuwe commando's kan begrijpen en erop kan reageren. Het systeem gaat verder dan de initiële roboticaopleiding en biedt een basisniveau van redeneren, zoals het maken van deducties met betrekking tot objectcategorisaties en beschrijvingen op hoog niveau. Dit vermogen onderstreept een indrukwekkende eigenschap van RT-2 waarbij het kan beslissen welk gereedschap geschikt is voor een compleet nieuwe taak, gebaseerd op reeds bestaande situationele informatie.
Vanhoucke illustreert dit met een voorbeeld waarbij RT-2 met succes afval identificeert en verwijdert. In traditionele modellen moest de gebruiker de robot trainen in het herkennen en categoriseren van afval en vervolgens verder instrueren hoe het afval te verzamelen en op te ruimen. Dergelijke gedetailleerde processen zijn niet erg schaalbaar wanneer ze worden toegepast op systemen die een uitgebreide lijst met taken moeten uitvoeren.
RT-2 kan echter kennis gebruiken uit een enorm corpus van webgegevens en heeft dus al een idee van wat afval is en kan dit aanwijzen zonder expliciete instructies, zoals Vanhoucke uitlegt. Het systeem begrijpt zelfs de handeling van het weggooien van afval, ondanks de afwezigheid van specifieke training over deze handeling. Een van de opvallende vaardigheden van RT-2 is het begrijpen van de abstracte aard van afval. Het begrijpt dat een gebruikte zak chips of een bananenschil kan worden gecategoriseerd als afval, leidt dit af uit de vision-taal trainingsgegevens en voert de vereiste actie dienovereenkomstig uit.
Het DeepMind team rapporteert een opmerkelijke verbetering in de succesratio van RT-2 bij het uitvoeren van nieuwe taken in vergelijking met zijn voorganger, van 32% naar 62% met deze nieuwe iteratie. Platformen zoals AppMaster kunnen zeer nuttig zijn bij de ontwikkeling van dergelijke transformatieve projecten, omdat ze een robuuste no-code tool bieden voor het maken van backend-, web- en mobiele applicaties die de workflow van het ontwikkelingsproces kunnen stroomlijnen. Met de nieuwe ontwikkelingen wordt niet alleen verwacht dat dergelijke platforms de efficiëntie van robotica zullen verbeteren, maar ook dat ze een nieuwe golf van technologische vooruitgang in verschillende sectoren zullen stimuleren.