Yapay Zeka Sistemlerini Daha Çok Yönlü Hale Getirmek İçin Genelleştirme Tekniklerini Kullanma

DeepMind'daki Açık Uçlu Öğrenme Ekibi adlı bir grup, yapay zeka sistemlerini oyun oynayacak şekilde eğitmenin yeni bir yolunu geliştirdi. DeepMind'daki grup, diğer oyun oynayan yapay zeka sistemlerinde yapıldığı gibi, onu milyonlarca önceki oyuna maruz bırakmak yerine, yeni yapay zeka sistemi temsilcilerine basit bir hedefe ulaşmak için (başka bir oyuncuyu tespit etmek gibi) kullanacakları bir dizi minimum beceri verdi. sanal bir dünyada) ve sonra bunun üzerine inşa edin. Araştırmacılar, genel bir video oyunu görünümüne sahip renkli bir sanal dünya olan XLand adında bir sanal dünya yarattılar. Burada araştırmacıların ajan olarak adlandırdığı yapay zeka oyuncuları genel bir hedefe ulaşmak için yola çıkıyor ve bunu yaparken de başka hedeflere ulaşmak için kullanabilecekleri beceriler kazanıyorlar. Araştırmacılar daha sonra oyunu değiştirerek ajanlara yeni bir hedef verir, ancak önceki oyunlarda öğrendikleri becerileri korumalarına da olanak tanır.

Tekniğin bir örneği, kendi dünyasının doğrudan tırmanılamayacak kadar yüksek olan ve merdiven veya rampa gibi erişim noktalarının bulunmadığı bir kısmına doğru yol almaya çalışan bir ajanı içerir. Ajan, etrafta dolaşırken, bulduğu düz bir nesneyi rampa görevi görecek şekilde hareket ettirebileceğini ve böylece gitmesi gereken yere kadar ilerleyebileceğini keşfeder. Aracıların daha fazla beceri öğrenmesine olanak sağlamak için araştırmacılar, aracıların yaklaşık 700,000 milyon benzersiz görevle karşı karşıya kaldığı 3.4 senaryo veya oyun oluşturdu. Bu yaklaşımı benimseyen temsilciler, etiketleme, bayrağı ele geçirme ve saklambaç gibi birden fazla oyunun nasıl oynanacağını kendilerine öğretebildiler. Araştırmacılar yaklaşımlarını sonsuz derecede zorlayıcı olarak nitelendiriyor. XLand'in bir başka ilginç yönü de, ajanları takip eden ve onların hangi becerileri öğrendiklerini not eden ve daha sonra onların becerilerini güçlendirmek için yeni oyunlar üreten bir tür derebeyin, bir varlığın var olmasıdır. Bu yaklaşımla temsilciler, kendilerine yeni görevler verildiği sürece öğrenmeye devam edeceklerdir.

Araştırmacılar, sanal dünyalarını yönetirken, aracıların genellikle kazara, faydalı buldukları yeni beceriler öğrendiklerini ve daha sonra bunları geliştirerek, seçenekler tükendiğinde deneylere başvurmak, diğer aracılarla işbirliği yapmak gibi daha gelişmiş becerilere yol açtığını buldular. ve nesnelerin araç olarak nasıl kullanılacağını öğrenmek. Yaklaşımlarının, yeni oyunları kendi başlarına nasıl oynayacağını öğrenen, genel olarak yetenekli algoritmalar yaratmaya yönelik bir adım olduğunu öne sürüyorlar; bu beceriler, bir gün otonom oyunlar tarafından kullanılabilecek. robotlar.

Yapay Zeka Sistemlerini Daha Çok Yönlü Hale Getirmek İçin Genelleştirme Tekniklerini Kullanmak