RoboCat của DeepMind cách mạng hóa hiệu suất tác vụ của người máy trên các mô hình khác nhau
Mô hình AI RoboCat của DeepMind thể hiện khả năng giải quyết và thích ứng với nhiều nhiệm vụ trên nhiều loại rô-bốt trong thế giới thực.

DeepMind gần đây đã công bố việc tạo ra RoboCat, một mô hình AI có thể thực hiện hiệu quả vô số tác vụ bằng cách sử dụng nhiều cánh tay rô-bốt trong thế giới thực. Cải tiến mang tính đột phá này là cải tiến đầu tiên thuộc loại này giải quyết hiệu quả một số nhiệm vụ trong khi thích ứng với các mô hình rô-bốt khác nhau, có khả năng hạ thấp rào cản giải quyết các nhiệm vụ mới trong chế tạo rô-bốt.
RoboCat được phát triển dựa trên mô hình trước đây của DeepMind có tên là Gato, có chức năng như một hệ thống AI có khả năng phân tích và tương tác với văn bản, hình ảnh và sự kiện. Nó được đào tạo dựa trên dữ liệu hình ảnh và hành động từ cả người máy mô phỏng và người máy ngoài đời thực. Dữ liệu được sử dụng để đào tạo bao gồm các mô hình điều khiển rô bốt trong môi trường ảo, rô bốt do con người điều khiển và các lần lặp lại trước đó của RoboCat.
Các nhà nghiên cứu bắt đầu đào tạo bằng cách thu thập 100 đến 1.000 bản trình diễn các nhiệm vụ hoặc dạy các cánh tay robot do con người điều khiển. Sau đó, RoboCat đã được điều chỉnh phù hợp với nhiệm vụ này, tạo ra các mô hình spin-off chuyên dụng để thực hành nhiệm vụ này khoảng 10.000 lần. Bằng cách phát triển bộ dữ liệu đào tạo của RoboCat bằng cách sử dụng dữ liệu mô hình spin-off và dữ liệu trình diễn, họ đã tạo ra các phiên bản mới hơn của mô hình AI.
Phiên bản cuối cùng của RoboCat đã được đào tạo trên tổng số 253 nhiệm vụ và sau đó được đo điểm chuẩn trên một tập hợp 141 biến thể của các nhiệm vụ này trong các tình huống mô phỏng và trong thế giới thực. DeepMind nhận thấy rằng sau khi quan sát 1.000 cuộc biểu tình do con người điều khiển, RoboCat đã thành thạo trong việc vận hành các loại cánh tay rô-bốt khác nhau. Hơn nữa, mặc dù được đào tạo trên rô-bốt có cánh tay hai ngạnh, nhưng mô hình AI có thể thích ứng với cánh tay phức tạp hơn với bộ kẹp ba ngón và gấp đôi số lượng đầu vào có thể điều khiển được.
Tuy nhiên, tỷ lệ thành công của mô hình thay đổi đáng kể từ 13% đến 99% trên nhiều nhiệm vụ tùy thuộc vào số lượng minh họa có trong dữ liệu đào tạo. Tuy nhiên, DeepMind tiết lộ rằng RoboCat có thể học các nhiệm vụ mới chỉ với 100 lần trình diễn trong một số trường hợp.
Các mục tiêu trong tương lai của nhóm nghiên cứu bao gồm giảm số lượng trình diễn cần thiết để dạy RoboCat một nhiệm vụ mới xuống dưới mười. Khi sự phát triển của các mô hình AI hỗ trợ các nhiệm vụ rô-bốt tiếp tục phát triển, việc tích hợp với các nền tảng low-code và no-code hiện đại như AppMaster có thể cải thiện hơn nữa khả năng tự động hóa và hiệu quả cho nhiều ngành công nghiệp, bao gồm sản xuất và hậu cần.
Các nền tảng như AppMaster không chỉ giúp doanh nghiệp giải quyết các vấn đề phức tạp một cách nhanh chóng mà còn giảm chi phí phát triển phần mềm. Khi các mô hình AI tiên tiến như RoboCat tiếp tục xuất hiện, việc kết hợp những mô hình này với các nền tảng low-code và no-code để quản lý các tác vụ trong các ngành khác nhau có tiềm năng cách mạng hóa quy trình kinh doanh, năng suất và đổi mới.


