DeepMind의 RoboCat은 다양한 모델에서 로봇 작업 성능을 혁신합니다
DeepMind의 RoboCat AI 모델은 다양한 실제 로봇에서 여러 작업을 해결하고 적응할 수 있는 능력을 보여줍니다.

DeepMind는 최근 여러 실제 로봇 팔을 활용하여 다양한 작업을 효율적으로 수행할 수 있는 AI 모델인 RoboCat 의 생성을 발표했습니다. 이 획기적인 혁신은 다양한 로봇 모델에 적응하면서 여러 과제를 효율적으로 처리하는 최초의 기술로, 잠재적으로 로봇 공학의 새로운 작업을 해결하기 위한 장벽을 낮춥니다.
RoboCat 텍스트, 이미지 및 이벤트를 분석하고 상호 작용할 수 있는 AI 시스템으로 작동하는 Gato 라는 DeepMind의 이전 모델을 기반으로 개발되었습니다. 시뮬레이션 및 실제 로봇 공학의 이미지 및 동작 데이터에 대해 교육을 받았습니다. 교육에 사용되는 데이터는 가상 환경 내의 로봇 제어 모델, 인간 제어 로봇 및 RoboCat 의 이전 반복으로 구성됩니다.
연구원들은 100~1,000개의 작업 시연을 수집하거나 인간이 제어하는 로봇 팔을 가르치는 방식으로 훈련을 시작했습니다. 그 후 RoboCat 작업에 대해 미세 조정되어 작업을 약 10,000회 연습하는 특수 스핀오프 모델을 생성했습니다. 스핀오프 모델 데이터와 데모 데이터를 사용하여 RoboCat 의 교육 데이터 세트를 확장하여 최신 버전의 AI 모델을 생성했습니다.
RoboCat 의 최종 버전은 총 253개의 작업에 대해 교육을 받은 다음 시뮬레이션 및 실제 시나리오에서 이러한 작업의 141개 변형 세트에 대해 벤치마킹했습니다. DeepMind는 1,000개의 인간 제어 시연을 관찰한 후 RoboCat 다양한 유형의 로봇 팔을 작동하는 데 능숙하다는 사실을 발견했습니다. 또한 두 갈래 팔이 있는 로봇에 대한 교육을 받았음에도 불구하고 AI 모델은 세 손가락 그리퍼와 제어 가능한 입력이 두 배 많은 더 복잡한 팔에 적응할 수 있습니다.
그러나 모델의 성공률은 교육 데이터에 포함된 데모의 수에 따라 여러 작업에 걸쳐 13%에서 99%까지 크게 달라졌습니다. 그럼에도 불구하고 DeepMind는 RoboCat 경우에 따라 100번의 데모만으로 새로운 작업을 학습할 수 있다고 밝혔습니다.
연구팀의 향후 목표는 RoboCat 새로운 작업을 가르치는 데 필요한 시연 횟수를 10회 미만으로 줄이는 것입니다. 로봇 작업을 지원하는 AI 모델의 개발이 계속 진행됨에 따라 AppMaster 와 같은 최신 low-code 및 no-code 플랫폼과의 통합은 제조 및 물류를 포함한 광범위한 산업의 자동화 및 효율성을 더욱 향상시킬 수 있습니다.
AppMaster 와 같은 플랫폼은 기업이 복잡한 문제를 신속하게 해결하는 데 도움이 될 뿐만 아니라 소프트웨어 개발 비용도 절감합니다. RoboCat 과 같은 고급 AI 모델이 계속 등장함에 따라 이를 low-code 및 no-code 플랫폼과 결합하여 다양한 산업의 작업을 관리하면 비즈니스 프로세스, 생산성 및 혁신을 혁신할 수 있는 잠재력이 있습니다.


