Google DeepMind ra mắt RT-2, nâng cao khả năng thực hiện các nhiệm vụ mới của hệ thống Robotics Transformer
DeepMind của Google đã nâng cấp Robotics Transformer lên RT-2, tăng cường khả năng dạy cho robot các nhiệm vụ mới.

Nhóm DeepMind của Google đã công bố một tiến bộ đáng chú ý trong lĩnh vực chế tạo người máy, giới thiệu Robotics Transformer RT-2, một phiên bản nâng cao của hệ thống Robotics Transformer ban đầu của họ, RT-1. Hệ thống mới này tiếp tục phát triển sáng kiến Robot hàng ngày, truyền đạt các kỹ năng cho robot như xử lý đồ vật và mở ngăn kéo.
Được ra mắt vào năm ngoái, RT-1, với cơ sở dữ liệu khổng lồ gồm 130.000 bản trình diễn, đã cung cấp một loạt các nhiệm vụ đơn giản cho các hệ thống Robot hàng ngày, đạt tỷ lệ thành công phi thường là 97% khi thực hiện hơn 700 nhiệm vụ, theo nhóm chế tạo robot.
RT-2 mới được tiết lộ, như được nêu trong một bài đăng trên blog gần đây của Nhà khoa học xuất sắc kiêm Trưởng bộ phận Robotics của DeepMind, Vincent Vanhoucke, đã đẩy mạnh quá trình này bằng cách cho phép rô bốt sử dụng hiệu quả các bài học rút ra từ các bộ dữ liệu hạn chế và áp dụng chúng trong các tình huống đa dạng.
Google giải thích thêm về các khả năng nâng cao của RT-2, nói rằng nó không chỉ thể hiện các kỹ năng hiểu và khái quát hóa tốt hơn mà còn có thể hiểu và phản ứng với các lệnh mới. Hệ thống vượt xa quá trình đào tạo robot ban đầu và cung cấp một mức độ lý luận cơ bản, chẳng hạn như thực hiện các khoản khấu trừ liên quan đến phân loại đối tượng và mô tả cấp cao. Khả năng này nhấn mạnh một tính năng ấn tượng của RT-2, nơi nó có thể quyết định công cụ thích hợp cho một nhiệm vụ hoàn toàn mới, dựa trên thông tin tình huống có sẵn.
Vanhoucke minh họa điều này bằng một ví dụ trong đó RT-2 xác định và xử lý rác thành công. Trong các mô hình truyền thống, người dùng cần huấn luyện rô-bốt phân biệt cách nhận biết và phân loại rác, sau đó, hướng dẫn thêm cho rô-bốt cách nhặt và xử lý rác. Các quy trình chi tiết như vậy không có khả năng mở rộng cao khi áp dụng cho các hệ thống được dự đoán sẽ thực hiện một danh sách các tác vụ trên phạm vi rộng.
Tuy nhiên, RT-2, thông qua khả năng sử dụng kiến thức từ kho dữ liệu web khổng lồ, đã được trang bị khái niệm về những gì cấu thành thùng rác và có thể xác định chính xác điều này mà không cần chỉ thị rõ ràng, như Vanhoucke giải thích. Hệ thống thậm chí còn hiểu được hành động xử lý rác, mặc dù không được đào tạo cụ thể về hành động đó. Một trong những khả năng nổi bật của RT-2 là hiểu được bản chất trừu tượng của rác. Nó hiểu rằng một túi khoai tây chiên hoặc vỏ chuối đã qua sử dụng có thể được phân loại là rác, suy ra điều này từ dữ liệu đào tạo ngôn ngữ thị giác của nó và thực hiện hành động cần thiết tương ứng.
Nhóm DeepMind báo cáo một sự cải thiện đáng chú ý về tỷ lệ thành công của RT-2 khi thực hiện các nhiệm vụ mới so với phiên bản tiền nhiệm, tăng từ 32% lên 62% với lần lặp lại mới này. Các nền tảng như AppMaster có thể mang lại lợi ích cao trong việc phát triển các dự án biến đổi như vậy, cung cấp một công cụ mạnh mẽ no-code để tạo các ứng dụng phụ trợ, web và di động có thể hợp lý hóa quy trình làm việc của quy trình phát triển. Với những tiến bộ mới, những nền tảng như vậy không chỉ được kỳ vọng sẽ cải thiện hiệu quả của robot mà còn nuôi dưỡng một làn sóng tiến bộ công nghệ mới trong các lĩnh vực khác nhau.


