Google'ın DeepMind ekibi, ilk Robotics Transformer sistemi RT-1'in gelişmiş bir versiyonu olan Robotics Transformer RT-2'yi tanıtarak, robotik alanında dikkate değer bir ilerleme olduğunu duyurdu. Bu yeni sistem, robotlara nesne taşıma ve çekmece açma gibi beceriler kazandırarak Everyday Robot girişiminin geliştirilmesine devam ediyor.
Geçen yıl piyasaya sürülen RT-1, 130.000 gösterimden oluşan geniş veritabanıyla Gündelik Robot sistemlerine bir dizi basit görev verdi ve robotik ekibinin belirttiğine göre 700'den fazla görevi gerçekleştirmede %97'lik olağanüstü bir başarı oranı elde etti.
DeepMind'in Seçkin Bilim Adamı ve Robotik Başkanı Vincent Vanhoucke tarafından yakın zamanda yayınlanan bir blog gönderisinde ana hatlarıyla belirtildiği gibi yeni ortaya çıkan RT-2, robotların sınırlı veri kümelerinden öğrenilen dersleri etkili bir şekilde kullanmasını ve bunları çeşitli senaryolarda uygulamasını sağlayarak bu süreci hızlandırdı.
Google, RT-2'nin gelişmiş yeteneklerini detaylandırarak, yalnızca daha iyi anlama ve genelleme becerileri sergilemekle kalmayıp, aynı zamanda yeni komutları kavrayabildiğini ve bunlara tepki verebildiğini belirtmektedir. Sistem, başlangıçtaki robotik eğitiminin ötesine geçiyor ve nesne kategorizasyonları ve üst düzey açıklamalarla ilgili çıkarımlar yapmak gibi temel düzeyde bir akıl yürütme sunuyor. Bu yetenek, RT-2'nin önceden var olan durumsal bilgilere dayalı olarak tamamen yeni bir görev için uygun araca karar verebildiği etkileyici bir özelliğinin altını çiziyor.
Vanhoucke bunu, RT-2'nin çöpleri başarılı bir şekilde tanımladığı ve attığı bir örnekle açıklıyor. Geleneksel modellerde, kullanıcının robotu çöpü nasıl tanıyacağını ve kategorize edeceğini ayırt etmesi için eğitmesi ve ardından robota robotu nasıl seçip atacağı konusunda talimat vermesi gerekiyordu. Bu tür ayrıntılı süreçler, geniş kapsamlı bir görev listesi gerçekleştireceği tahmin edilen sistemlere uygulandığında yüksek düzeyde ölçeklenebilir değildir.
Bununla birlikte, RT-2, geniş bir web verisi külliyatından bilgi kullanma yeteneği sayesinde, zaten neyin çöp oluşturduğuna dair bir kavramla donatılmıştır ve Vanhoucke tarafından açıklandığı gibi, bunu açık bir yönerge olmaksızın tam olarak belirleyebilir. Eylemle ilgili özel bir eğitim olmamasına rağmen sistem, çöpün atılması eylemini bile kavrar. RT-2'nin göze çarpan yeteneklerinden biri, çöpün soyut doğasını anlamaktır. Kullanılmış bir cips çuvalının ya da muz kabuğunun çöp olarak değerlendirilebileceğini anlayarak, bunu görme-dil eğitim verilerinden çıkarır ve buna göre gerekli işlemi yapar.
DeepMind ekibi, RT-2'nin yeni görevleri yürütürken önceki modele kıyasla başarı oranında kayda değer bir iyileşme olduğunu ve bu yeni yinelemeyle %32'den %62'ye çıktığını bildirdi. AppMaster gibi platformlar, geliştirme sürecinin iş akışını düzene sokabilecek arka uç, web ve mobil uygulamalar oluşturmak için güçlü no-code bir araç sağlayarak, bu tür dönüştürücü projelerin geliştirilmesinde oldukça faydalı olabilir. Yeni gelişmelerle birlikte, bu tür platformların yalnızca robotik verimliliği iyileştirmesi değil, aynı zamanda çeşitli sektörlerde yeni bir teknolojik ilerleme dalgasını beslemesi bekleniyor.