Google의 DeepMind 팀은 초기 Robotics Transformer 시스템인 RT-1의 고급 버전인 Robotics Transformer RT-2를 소개하면서 로봇 공학 분야의 놀라운 발전을 발표했습니다. 이 새로운 시스템은 Everyday Robot 이니셔티브의 개발을 계속하여 물체 취급 및 서랍 열기와 같은 기술을 로봇에 부여합니다.
작년에 출시된 RT-1은 방대한 130,000개의 시연 데이터베이스를 통해 Everyday Robot 시스템에 일련의 간단한 작업을 부여했으며, 로봇 팀에 따르면 700개 이상의 작업을 실행하는 데 있어 97%의 놀라운 성공률을 달성했습니다.
새로 공개된 RT-2는 DeepMind의 저명한 과학자이자 로봇 공학 책임자인 Vincent Vanhoucke의 최근 블로그 게시물에 요약된 대로 로봇이 제한된 데이터 세트에서 학습한 교훈을 효과적으로 활용하고 다양한 시나리오에 적용할 수 있도록 함으로써 이 프로세스를 확대했습니다.
Google은 RT-2의 향상된 기능에 대해 자세히 설명하면서 더 나은 이해 및 일반화 기술을 보여줄 뿐만 아니라 새로운 명령을 이해하고 반응할 수 있다고 말했습니다. 이 시스템은 초기 로봇 교육을 넘어 개체 분류 및 높은 수준의 설명과 관련된 추론을 만드는 것과 같은 기본 수준의 추론을 제공합니다. 이 기능은 기존 상황 정보를 기반으로 완전히 새로운 작업에 적합한 도구를 결정할 수 있는 RT-2의 인상적인 기능을 강조합니다.
Vanhoucke는 RT-2가 성공적으로 쓰레기를 식별하고 처리하는 예를 통해 이를 설명합니다. 기존 모델에서 사용자는 쓰레기를 인식하고 분류하는 방법을 식별하도록 로봇을 훈련시킨 다음 쓰레기를 선택하고 처리하는 방법에 대해 추가로 지시해야 했습니다. 이러한 세부 프로세스는 광범위한 작업 목록을 수행할 것으로 예상되는 시스템에 적용할 때 확장성이 높지 않습니다.
그러나 RT-2는 방대한 웹 데이터 코퍼스의 지식을 활용하는 기능을 통해 이미 쓰레기를 구성하는 개념을 갖추고 있으며 Vanhoucke의 설명처럼 명시적인 지시 없이도 이를 정확히 찾아낼 수 있습니다. 이 시스템은 행동에 대한 구체적인 교육이 없음에도 불구하고 쓰레기를 처리하는 행동까지 이해합니다. RT-2의 뛰어난 능력 중 하나는 쓰레기의 추상적 특성을 이해하는 것입니다. 사용된 칩이나 바나나 껍질이 쓰레기로 분류될 수 있음을 이해하고 이를 비전 언어 교육 데이터에서 추론하고 그에 따라 필요한 조치를 실행합니다.
DeepMind 팀은 이전 버전과 비교하여 새로운 작업을 실행할 때 RT-2의 성공률이 눈에 띄게 향상되어 이 새로운 반복으로 32%에서 62%로 증가했다고 보고합니다. AppMaster 와 같은 플랫폼은 개발 프로세스의 워크플로를 간소화할 수 있는 백엔드, 웹 및 모바일 애플리케이션을 생성하기 위한 강력한 no-code 도구를 제공하여 이러한 혁신적인 프로젝트의 개발에 매우 유용할 수 있습니다. 새로운 발전으로 이러한 플랫폼은 로봇 효율을 향상시킬 뿐만 아니라 다양한 분야에서 새로운 기술 발전의 물결을 키울 것으로 기대됩니다.