Araştırmacılar Yapay Zeka Görüntü Oluşturma Üzerinde İnce Ayar Yapıyor

Araştırmacılar Yapay Zeka Görüntü Üretimi Üzerinde İnce Ayar Yapıyor

North Carolina Eyalet Üniversitesi'nden araştırmacılar, yapay zeka (AI) sistemlerinin nasıl görüntü oluşturduğunu kontrol etmek için son teknoloji ürünü yeni bir yöntem geliştirdi. Çalışmanın otonom robotikten yapay zeka eğitimine kadar çeşitli alanlara yönelik uygulamaları var.

Sorun, yapay zeka sistemlerinin belirli bir dizi koşulu karşılayan görüntüler oluşturduğu, koşullu görüntü oluşturma adı verilen bir tür yapay zeka görevidir. Örneğin bir sistem, kullanıcının talep ettiği hayvana bağlı olarak kedi veya köpeklerin orijinal görüntülerini oluşturacak şekilde eğitilebilir. Daha yeni teknikler, görüntü düzeniyle ilgili koşulları birleştirmek için bunun üzerine inşa edilmiştir. Bu, kullanıcıların ekranın belirli yerlerinde hangi tür nesnelerin görünmesini istediklerini belirlemelerine olanak tanır. Örneğin gökyüzü bir kutuya, bir ağaç başka bir kutuya, bir dere ayrı bir kutuya vb. girebilir.

Yeni çalışma, kullanıcılara ortaya çıkan görüntüler üzerinde daha fazla kontrol sağlamak ve bir dizi görüntüde belirli özellikleri korumak için bu tekniklerin üzerine inşa ediliyor.

Çalışmayla ilgili bir makalenin ortak yazarı ve NC State'de bilgisayar mühendisliği yardımcı doçenti olan Tianfu Wu, "Yaklaşımımız son derece yeniden yapılandırılabilir" diyor. "Önceki yaklaşımlar gibi bizim yaklaşımımız da kullanıcıların sistemin belirli koşullara dayalı bir görüntü oluşturmasına olanak tanıyor. Ancak bizimki aynı zamanda bu görüntüyü korumanıza ve ona ekleme yapmanıza da olanak tanır. Örneğin kullanıcılar yapay zekanın bir dağ manzarası oluşturmasını sağlayabilir. Kullanıcılar daha sonra sistemin o sahneye kayakçı eklemesini sağlayabilir."

Buna ek olarak, yeni yaklaşım, kullanıcıların yapay zekanın belirli öğeleri, tanımlanabilir şekilde aynı olacak, ancak bir şekilde taşınmış veya değiştirilmiş olacak şekilde manipüle etmesine olanak tanıyor. Örneğin yapay zeka, kayakçıların arazide hareket ederken izleyiciye doğru döndüğünü gösteren bir dizi görüntü oluşturabilir.

Wu, "Bunun bir uygulaması, otonom robotların belirli bir göreve başlamadan önce nihai sonucun nasıl görünebileceğini 'hayal etmelerine' yardımcı olmak olabilir" diyor. "Sistemi yapay zeka eğitimi için görüntüler oluşturmak amacıyla da kullanabilirsiniz. Dolayısıyla, harici kaynaklardan görsel derlemek yerine, bu sistemi diğer yapay zeka sistemlerini eğitmek amacıyla görseller oluşturmak için kullanabilirsiniz."

Araştırmacılar yeni yaklaşımlarını COCO-Stuff veri setini ve Visual Genome veri setini kullanarak test ettiler. Standart görüntü kalitesi ölçümlerine dayanan yeni yaklaşım, önceki en gelişmiş görüntü oluşturma tekniklerinden daha iyi performans gösterdi.

Wu, "Bir sonraki adımımız, bu çalışmayı video ve üç boyutlu görüntülere genişletip genişletemeyeceğimizi görmek," diyor.

Yeni yaklaşıma yönelik eğitim, makul miktarda hesaplama gücü gerektirir; araştırmacılar 4 GPU'lu bir iş istasyonu kullandılar. Ancak sistemin dağıtılması hesaplama açısından daha az maliyetlidir.

“Bunu bulduk GPU size neredeyse gerçek zamanlı hız sağlıyor” diyor Wu

Araştırmacılar Yapay Zeka Görüntü Üretimi Üzerinde İnce Ayar Yapıyor