A equipa DeepMind da Google anunciou um progresso notável na esfera da robótica, apresentando o Robotics Transformer RT-2, uma versão avançada do seu sistema inicial Robotics Transformer, RT-1. Este novo sistema continua o desenvolvimento da iniciativa Everyday Robot, transmitindo competências aos robôs, como o manuseamento de objectos e a abertura de gavetas.
Lançado no ano passado, o RT-1, com a sua vasta base de dados de 130.000 demonstrações, transmitiu uma série de tarefas simples aos sistemas Everyday Robot, atingindo uma taxa de sucesso fenomenal de 97% na execução de mais de 700 tarefas, declarada pela equipa de robótica.
O recém-revelado RT-2, tal como descrito numa recente publicação no blogue de Vincent Vanhoucke, ilustre cientista e diretor de robótica da DeepMind, aumentou este processo ao permitir que os robôs utilizem eficazmente as lições aprendidas a partir de conjuntos de dados limitados e as apliquem em diversos cenários.
A Google explica as capacidades melhoradas do RT-2, afirmando que este não só apresenta melhores capacidades de compreensão e generalização, como também consegue compreender e reagir a novos comandos. O sistema vai além da sua formação robótica inicial e oferece um nível básico de raciocínio, como fazer deduções relativamente a categorizações de objectos e descrições de alto nível. Esta capacidade sublinha uma caraterística impressionante do RT-2, que lhe permite decidir qual a ferramenta adequada para uma tarefa completamente nova, com base em informações situacionais pré-existentes.
Vanhoucke ilustra este facto com um exemplo em que o RT-2 identifica e elimina com êxito o lixo. Nos modelos tradicionais, o utilizador precisava de treinar o robô para saber como reconhecer e classificar o lixo e, em seguida, dar-lhe instruções sobre como o recolher e eliminar. Estes processos pormenorizados não são altamente escaláveis quando aplicados a sistemas que se prevê venham a executar uma lista alargada de tarefas.
No entanto, o RT-2, através da sua capacidade de utilizar o conhecimento de um vasto corpus de dados da Web, já está equipado com um conceito do que constitui lixo e pode identificá-lo sem uma diretiva explícita, como explica Vanhoucke. O sistema compreende mesmo a ação de deitar fora o lixo, apesar da ausência de formação específica sobre essa ação. Uma das capacidades de destaque do RT-2 é a compreensão da natureza abstrata do lixo. Compreende que um saco de batatas fritas usado ou uma casca de banana podem ser classificados como lixo, deduzindo-o dos seus dados de formação em linguagem de visão, e executa a ação necessária em conformidade.
A equipa DeepMind relata uma melhoria notável na taxa de sucesso do RT-2 ao executar novas tarefas em comparação com o seu antecessor, aumentando de 32% para 62% com esta nova iteração. Plataformas como o AppMaster podem ser altamente benéficas no desenvolvimento de tais projectos transformadores, fornecendo uma ferramenta no-code robusta para a criação de aplicações backend, web e móveis que podem simplificar o fluxo de trabalho do processo de desenvolvimento. Com os novos avanços, espera-se que essas plataformas não só melhorem a eficiência da robótica, mas também alimentem uma nova onda de avanços tecnológicos em vários sectores.