Sitemize üye olarak beğendiğiniz içerikleri favorilerinize ekleyebilir, kendi ürettiğiniz ya da internet üzerinde beğendiğiniz içerikleri sitemizin ziyaretçilerine içerik gönder seçeneği ile sunabilirsiniz.
Zaten bir üyeliğiniz mevcut mu ? Giriş yapın
Sitemize üye olarak beğendiğiniz içerikleri favorilerinize ekleyebilir, kendi ürettiğiniz ya da internet üzerinde beğendiğiniz içerikleri sitemizin ziyaretçilerine içerik gönder seçeneği ile sunabilirsiniz.
Üyelerimize Özel Tüm Opsiyonlardan Kayıt Olarak Faydalanabilirsiniz
WhatsApp Sesli Mesajlara Altyazı Özelliği
Google’ın yapay zeka birimi DeepMind, robotların navigasyon ve görev tamamlama yeteneklerini geliştirmek için Gemini AI teknolojisini kullanıyor. Yeni bir araştırma makalesi, Gemini 1.5 Pro’nun geniş bağlam penceresinin, kullanıcıların RT-2 robotlarıyla doğal dil talimatlarını kullanarak daha kolay etkileşim kurmasına nasıl izin verdiğini açıklıyor.
İçindekiler
ToggleDeepMind araştırmacıları, ev veya ofis alanı gibi belirlenmiş bir alanın video turunu çekerek ve Gemini 1.5 Pro’yu kullanarak robotu videoyu “izlemeye” ve ortamı öğrenmeye teşvik ediyor. Gemini AI sayesinde robot, gözlemlediklerine dayanarak sözlü ve/veya görüntü çıktılarını kullanarak komutları yerine getirebiliyor. Örneğin, bir telefon gösterildiğinde ve “bunu nerede şarj edebilirim?” diye sorulduğunda, robot kullanıcıları bir güç çıkışına yönlendirebiliyor.
DeepMind, Gemini AI destekli robotunun, 9.000’den fazla metrekarelik bir çalışma alanında verilen 50’den fazla kullanıcı talimatında %90 başarı oranına sahip olduğunu belirtiyor. Araştırmacılar ayrıca, Gemini 1.5 Pro’nun robotların sadece navigasyon değil, talimatları yerine getirme planlamasını da sağladığına dair “ön kanıtlar” buldu.
Örneğin, masasında çok fazla Coca-Cola kutusu olan bir kullanıcı, robotuna en sevdiği içeceğin mevcut olup olmadığını sorduğunda, Gemini AI’nın “robotun buzdolabına gitmesi, Coca-Cola’ların olup olmadığını kontrol etmesi ve ardından kullanıcıya sonucu bildirmek için geri dönmesi gerektiğini bildiğini” belirtiyor. DeepMind, bu sonuçları daha fazla araştırmayı planlıyor.
Google tarafından sağlanan video gösterimleri etkileyici olsa da, her isteği onayladıktan sonraki kesintiler, araştırma makalesine göre bu talimatları işlemenin 10-30 saniye sürdüğünü gizliyor. Daha gelişmiş ortam haritalama robotlarıyla evlerimizi paylaşmamız biraz zaman alabilir, ancak en azından bu robotlar kayıp anahtarlarımızı veya cüzdanlarımızı bulabilir.
Yorum Yaz