Ms Pac-Man

Ms Pac-Man zaferi

Bazı işler vardır ki hepsiyle aynı anda uğraşmak çok karmaşık, çok çetrefillidir. Tıpkı 256 aşamadan oluşan Atari 2600 oyunu Ms Pac-Man ’i 999.990 puanla yenmek gibi. Bu yüzden Microsoft da yapay zekasını tek bir hamlede yenmeye ayarlamamış. Bunun yerine firma bu abidevi karşılaşmayı küçük parçalar halinde bölümlere ayırmış ve 150 yapay zekadan oluşan kovan tipi hafızayı eğiterek, bunları bir ekip olarak kullanmış.

Microsoft’un yakın bir tarihte satın aldığı Kanada’da mukim bir yapay zeka firması olan Maluuba’nın geliştirdiği bu yapay zeka sistemi stratejisini geliştirmek için takviye etmeyi öğrenme metodunu kullanıyor. Takviye etmeyi öğrenme, algoritmanın daha etkin kazanımların kullanımına dayalı. Daha önce edinilen daha az etkin kazanımların kullanımından kaçınılan bir algoritma tipi. Yani, yeterli zaman ve deneme ile sistem, en iyi hareket şeklinin ne olduğunu kendi kendine belirleyebiliyor. Bu teknik, Google’ın Go şampiyonlarını yenmede kullandığı teknikle aynı.

Alt-görev birimleri

Fakat yeterince kompleks görevler söz konusu olduğunda sıradan bir takviye etmeyi öğrenme sistemi oldukça yavaş kalıyor. Shakespear’in tüm çalışmalarını daktiloda yeniden yazan maymunları düşünün. Bu nedenle Maluuba’nın ekibi görevi, daha küçük alt görevlere ayırmış. Tıpkı hayaletlerden kaçınmak ya da labirent içerisindeki belirli bir hapı yemek gibi. Ve sonra da çözüm yoluna ulaşmaları için her birine 150 paralel sinir ağından biri verilmiş. Ekip daha sonra bu ağ zincirinin tepesine yönetici bir yapay zeka yerleştirmiş ve böylece sürünün faaliyetlerini yönetmeyi ve oyunda galip gelme maksadını gerçekleştirmeye yardımcı olmayı başarmış.

OKU ►  NASA buzlu ayların yüzeyini kırmak için robotik araç kullanımını test ediyor

Yönetici yapay zeka her bir alt birim yapay zekanın mevcut senaryo içerisindeki tepkisini alıyor, ölçüp biçiyor ve grup adına bir karar veriyor. Yani, alt birim yapay zekaların yarısı ‘Sağa git, o hapı ye’ derken,bir kaçı ise ‘hayır, yapma, o yolun sonunda hayalet var’ deseler, yönetici yapay zeka ölmeme ihtimalini, hapı yemeye tercih ediyor. Ekip, özgün sistemini ‘Hibrit Ödüllendirme Mimarisi’ olarak tanıtıyor.

CEVAP VER

Please enter your comment!
Please enter your name here