谷歌 DeepMind 团队宣布在机器人技术领域取得重大进展,推出了机器人变形金刚 RT-2,这是他们最初的机器人变形金刚系统 RT-1 的高级版本。这一新系统延续了 "日常机器人"(Everyday Robot)计划的发展,向机器人传授物体搬运和打开抽屉等技能。
去年推出的 RT-1 拥有 13 万次演示的庞大数据库,向 Everyday Robot 系统传授了一系列简单的任务,在执行 700 多项任务时,成功率高达 97%。
DeepMind 的杰出科学家兼机器人技术主管文森特-范霍克(Vincent Vanhoucke)在最近的一篇博文中概述了最新推出的 RT-2,它使机器人能够有效利用从有限的数据集中学到的经验,并将其应用于不同的场景,从而将这一过程升级。
谷歌详细阐述了 RT-2 的增强功能,指出它不仅具有更好的理解和概括能力,还能理解新指令并做出反应。该系统超越了最初的机器人训练,具备了基本的推理能力,例如对物体分类和高级描述进行推理。这种能力凸显了 RT-2 令人印象深刻的一个特点,即它可以根据已有的情景信息,为全新的任务选择合适的工具。
Vanhoucke 以 RT-2 成功识别和处理垃圾为例说明了这一点。在传统模式中,用户需要对机器人进行训练,使其辨别如何识别垃圾并将其分类,然后再进一步指导机器人如何拣拾和处理垃圾。当系统被用于执行一系列任务时,这种详细的过程并不具有很强的可扩展性。
然而,RT-2 通过利用大量网络数据中的知识,已经具备了垃圾分类的概念,并能在没有明确指令的情况下准确定位,正如 Vanhoucke 所解释的那样。该系统甚至能理解丢弃垃圾的动作,尽管没有对这一动作进行专门训练。RT-2 的突出能力之一是理解垃圾的抽象性质。它能从视觉语言训练数据中推断出一袋用过的薯片或香蕉皮可以归类为垃圾,并据此执行所需的操作。
DeepMind 团队报告称,RT-2 执行新任务的成功率与前代相比有了显著提高,从 32% 提高到 62%。像AppMaster 这样的平台对开发此类变革性项目大有裨益,它为创建后台、网络和移动应用程序提供了一个强大的no-code 工具,可以简化开发过程的工作流程。随着新技术的进步,此类平台不仅有望提高机器人效率,还将在各行各业掀起新一轮的技术进步浪潮。