ทีม DeepMind ของ Google ได้ประกาศความก้าวหน้าอันน่าทึ่งในแวดวงวิทยาการหุ่นยนต์ โดยเปิดตัว Robotics Transformer RT-2 ซึ่งเป็นเวอร์ชันขั้นสูงของระบบ Robotics Transformer รุ่นเริ่มต้น RT-1 ระบบใหม่นี้สานต่อการพัฒนาโครงการ Everyday Robot โดยมอบทักษะให้กับหุ่นยนต์ เช่น การจัดการวัตถุและการเปิดลิ้นชัก
เปิดตัวเมื่อปีที่แล้ว RT-1 พร้อมฐานข้อมูลขนาดใหญ่ของการสาธิต 130,000 รายการ มอบหมายงานง่ายๆ ให้กับระบบ Everyday Robot โดยได้รับอัตราความสำเร็จอย่างน่าอัศจรรย์ที่ 97% ในการดำเนินการมากกว่า 700 งานตามที่ทีมวิทยาการหุ่นยนต์ระบุ
RT-2 ที่เพิ่งเปิดเผยตามที่ระบุไว้ในบล็อกโพสต์ล่าสุดโดยนักวิทยาศาสตร์ที่โดดเด่นของ DeepMind และหัวหน้าฝ่ายวิทยาการหุ่นยนต์ Vincent Vanhoucke ได้ยกระดับกระบวนการนี้โดยทำให้หุ่นยนต์สามารถใช้บทเรียนที่เรียนรู้จากชุดข้อมูลที่จำกัดได้อย่างมีประสิทธิภาพ และนำไปใช้ในสถานการณ์ที่หลากหลาย
Google อธิบายเพิ่มเติมเกี่ยวกับความสามารถที่ได้รับการปรับปรุงของ RT-2 โดยระบุว่าไม่เพียงแสดงความเข้าใจที่ดีขึ้นและทักษะทั่วไปเท่านั้น แต่ยังสามารถเข้าใจและตอบสนองต่อคำสั่งใหม่ได้อีกด้วย ระบบนี้ไปไกลกว่าการฝึกอบรมหุ่นยนต์ขั้นต้นและให้เหตุผลในระดับพื้นฐาน เช่น การอนุมานเกี่ยวกับการจัดหมวดหมู่วัตถุและคำอธิบายระดับสูง ความสามารถนี้ตอกย้ำคุณลักษณะที่น่าประทับใจของ RT-2 ซึ่งสามารถตัดสินใจเลือกเครื่องมือที่เหมาะสมสำหรับงานใหม่ทั้งหมด โดยอิงจากข้อมูลสถานการณ์ที่มีอยู่แล้ว
Vanhoucke แสดงสิ่งนี้ด้วยตัวอย่างที่ RT-2 ระบุและกำจัดขยะได้สำเร็จ ในรูปแบบดั้งเดิม ผู้ใช้จำเป็นต้องฝึกหุ่นยนต์ให้แยกแยะวิธีการจดจำและจัดประเภทขยะ จากนั้นจึงสั่งการเพิ่มเติมเกี่ยวกับวิธีการหยิบและทิ้ง กระบวนการที่มีรายละเอียดดังกล่าวไม่สามารถปรับขนาดได้สูงเมื่อนำไปใช้กับระบบที่คาดว่าจะดำเนินการตามรายการงานที่หลากหลาย
อย่างไรก็ตาม ด้วยความสามารถของ RT-2 ในการใช้ความรู้จากคลังข้อมูลเว็บจำนวนมหาศาล ทำให้มีแนวคิดเกี่ยวกับสิ่งที่ก่อให้เกิดขยะและสามารถระบุสิ่งนี้ได้โดยไม่ต้องมีคำสั่งที่ชัดเจน ตามที่อธิบายโดย Vanhoucke ระบบยังเข้าใจการดำเนินการกำจัดขยะแม้ว่าจะไม่มีการฝึกอบรมเฉพาะเกี่ยวกับการดำเนินการก็ตาม ความสามารถที่โดดเด่นอย่างหนึ่งของ RT-2 คือการเข้าใจธรรมชาติที่เป็นนามธรรมของขยะ มันเข้าใจว่าถุงชิปหรือเปลือกกล้วยที่ใช้แล้วสามารถจัดประเภทเป็นขยะได้ โดยอนุมานสิ่งนี้จากข้อมูลการฝึกอบรมภาษาการมองเห็น และดำเนินการที่จำเป็นตามนั้น
ทีม DeepMind รายงานการปรับปรุงที่โดดเด่นในอัตราความสำเร็จของ RT-2 เมื่อดำเนินการงานใหม่เมื่อเปรียบเทียบกับรุ่นก่อน โดยเพิ่มขึ้นจาก 32% เป็น 62% ด้วยการทำซ้ำใหม่นี้ แพลตฟอร์มเช่น AppMaster สามารถเป็นประโยชน์อย่างมากในการพัฒนาโครงการที่เปลี่ยนแปลงดังกล่าว โดยจัดเตรียมเครื่องมือ no-code ที่มีประสิทธิภาพสำหรับการสร้างแบ็กเอนด์ เว็บ และแอปพลิเคชันมือถือที่สามารถปรับปรุงเวิร์กโฟลว์ของกระบวนการพัฒนาได้ ด้วยความก้าวหน้าใหม่ๆ แพลตฟอร์มดังกล่าวไม่เพียงคาดหวังให้ปรับปรุงประสิทธิภาพของหุ่นยนต์เท่านั้น แต่ยังส่งเสริมความก้าวหน้าทางเทคโนโลยีระลอกใหม่ในภาคส่วนต่างๆ