29 de jul. de 2023·1 min de leitura

Google DeepMind revela RT-2, melhorando a capacidade do sistema Robotics Transformer para executar novas tarefas

A DeepMind da Google actualizou o Robotics Transformer para RT-2, melhorando a sua capacidade de ensinar novas tarefas aos robôs.

Google DeepMind revela RT-2, melhorando a capacidade do sistema Robotics Transformer para executar novas tarefas

A equipa DeepMind da Google anunciou um progresso notável na esfera da robótica, apresentando o Robotics Transformer RT-2, uma versão avançada do seu sistema inicial Robotics Transformer, RT-1. Este novo sistema continua o desenvolvimento da iniciativa Everyday Robot, transmitindo competências aos robôs, como o manuseamento de objectos e a abertura de gavetas.

Lançado no ano passado, o RT-1, com a sua vasta base de dados de 130.000 demonstrações, transmitiu uma série de tarefas simples aos sistemas Everyday Robot, atingindo uma taxa de sucesso fenomenal de 97% na execução de mais de 700 tarefas, declarada pela equipa de robótica.

O recém-revelado RT-2, tal como descrito numa recente publicação no blogue de Vincent Vanhoucke, ilustre cientista e diretor de robótica da DeepMind, aumentou este processo ao permitir que os robôs utilizem eficazmente as lições aprendidas a partir de conjuntos de dados limitados e as apliquem em diversos cenários.

A Google explica as capacidades melhoradas do RT-2, afirmando que este não só apresenta melhores capacidades de compreensão e generalização, como também consegue compreender e reagir a novos comandos. O sistema vai além da sua formação robótica inicial e oferece um nível básico de raciocínio, como fazer deduções relativamente a categorizações de objectos e descrições de alto nível. Esta capacidade sublinha uma caraterística impressionante do RT-2, que lhe permite decidir qual a ferramenta adequada para uma tarefa completamente nova, com base em informações situacionais pré-existentes.

Vanhoucke ilustra este facto com um exemplo em que o RT-2 identifica e elimina com êxito o lixo. Nos modelos tradicionais, o utilizador precisava de treinar o robô para saber como reconhecer e classificar o lixo e, em seguida, dar-lhe instruções sobre como o recolher e eliminar. Estes processos pormenorizados não são altamente escaláveis quando aplicados a sistemas que se prevê venham a executar uma lista alargada de tarefas.

No entanto, o RT-2, através da sua capacidade de utilizar o conhecimento de um vasto corpus de dados da Web, já está equipado com um conceito do que constitui lixo e pode identificá-lo sem uma diretiva explícita, como explica Vanhoucke. O sistema compreende mesmo a ação de deitar fora o lixo, apesar da ausência de formação específica sobre essa ação. Uma das capacidades de destaque do RT-2 é a compreensão da natureza abstrata do lixo. Compreende que um saco de batatas fritas usado ou uma casca de banana podem ser classificados como lixo, deduzindo-o dos seus dados de formação em linguagem de visão, e executa a ação necessária em conformidade.

A equipa DeepMind relata uma melhoria notável na taxa de sucesso do RT-2 ao executar novas tarefas em comparação com o seu antecessor, aumentando de 32% para 62% com esta nova iteração. Plataformas como o AppMaster podem ser altamente benéficas no desenvolvimento de tais projectos transformadores, fornecendo uma ferramenta no-code robusta para a criação de aplicações backend, web e móveis que podem simplificar o fluxo de trabalho do processo de desenvolvimento. Com os novos avanços, espera-se que essas plataformas não só melhorem a eficiência da robótica, mas também alimentem uma nova onda de avanços tecnológicos em vários sectores.

Easy to start
Create something amazing

Experiment with AppMaster with free plan.
When you will be ready you can choose the proper subscription.

Get Started