Google DeepMind presenta RT-2, que mejora la capacidad del sistema robótico Transformer para ejecutar tareas novedosas
DeepMind, de Google, ha actualizado Robotics Transformer a RT-2, mejorando su capacidad para enseñar nuevas tareas a los robots.

El equipo DeepMind de Google ha anunciado un notable avance en el ámbito de la robótica al presentar Robotics Transformer RT-2, una versión avanzada de su sistema inicial Robotics Transformer, RT-1. Este nuevo sistema continúa el desarrollo de la iniciativa Everyday Robot, dotando a los robots de habilidades como la manipulación de objetos y la apertura de cajones.
Lanzado el año pasado, el RT-1, con su amplia base de datos de 130.000 demostraciones, impartió una serie de tareas sencillas a los sistemas Everyday Robot, alcanzando una fenomenal tasa de éxito del 97% en la ejecución de más de 700 tareas, según declaró el equipo de robótica.
El recién revelado RT-2, como se indica en una reciente entrada de blog de Vincent Vanhoucke, científico distinguido y director de robótica de DeepMind, ha intensificado este proceso al permitir a los robots utilizar eficazmente las lecciones aprendidas a partir de conjuntos de datos limitados y aplicarlas en diversos escenarios.
Google explica las capacidades mejoradas de RT-2 afirmando que no sólo muestra mejores habilidades de comprensión y generalización, sino que también puede comprender nuevas órdenes y reaccionar ante ellas. El sistema va más allá de su entrenamiento robótico inicial y ofrece un nivel básico de razonamiento, como hacer deducciones sobre categorizaciones de objetos y descripciones de alto nivel. Esta capacidad subraya una característica impresionante del RT-2: puede decidir cuál es la herramienta adecuada para una tarea completamente nueva, basándose en información situacional preexistente.
Vanhoucke lo ilustra con un ejemplo en el que RT-2 identifica y elimina la basura. En los modelos tradicionales, el usuario tenía que enseñar al robot a reconocer y clasificar la basura y, a continuación, darle instrucciones sobre cómo recogerla y deshacerse de ella. Estos procesos tan detallados no son muy escalables cuando se aplican a sistemas que deben realizar una amplia lista de tareas.
Sin embargo, RT-2, gracias a su capacidad para utilizar los conocimientos de un vasto corpus de datos web, ya está equipado con un concepto de lo que constituye basura y puede señalarlo sin una directiva explícita, como explica Vanhoucke. El sistema comprende incluso la acción de deshacerse de la basura, a pesar de no haber recibido formación específica al respecto. Una de las capacidades más destacadas de RT-2 es la comprensión de la naturaleza abstracta de la basura. Entiende que una bolsa de patatas fritas usada o una cáscara de plátano pueden considerarse basura, lo que deduce de sus datos de entrenamiento de visión y lenguaje, y ejecuta la acción necesaria en consecuencia.
El equipo de DeepMind informa de una notable mejora en la tasa de éxito de RT-2 a la hora de ejecutar nuevas tareas en comparación con su predecesor, pasando del 32% al 62% con esta nueva iteración. Plataformas como AppMaster pueden ser muy beneficiosas en el desarrollo de proyectos tan transformadores, ya que proporcionan una sólida herramienta no-code para crear aplicaciones backend, web y móviles que pueden agilizar el flujo de trabajo del proceso de desarrollo. Con los nuevos avances, se espera que este tipo de plataformas no sólo mejoren la eficiencia de la robótica, sino que también alimenten una nueva ola de avances tecnológicos en diversos sectores.


