Microsoft’un Yapay Zeka’sı Ms Pac-Man’de muhteşem bir sayı kazandı

Date:

Ms Pac-Man zaferi

Bazı işler vardır ki hepsiyle aynı anda uğraşmak çok karmaşık, çok çetrefillidir. Tıpkı 256 aşamadan oluşan Atari 2600 oyunu Ms Pac-Man ’i 999.990 puanla yenmek gibi. Bu yüzden Microsoft da yapay zekasını tek bir hamlede yenmeye ayarlamamış. Bunun yerine firma bu abidevi karşılaşmayı küçük parçalar halinde bölümlere ayırmış ve 150 yapay zekadan oluşan kovan tipi hafızayı eğiterek, bunları bir ekip olarak kullanmış.

Microsoft’un yakın bir tarihte satın aldığı Kanada’da mukim bir yapay zeka firması olan Maluuba’nın geliştirdiği bu yapay zeka sistemi stratejisini geliştirmek için takviye etmeyi öğrenme metodunu kullanıyor. Takviye etmeyi öğrenme, algoritmanın daha etkin kazanımların kullanımına dayalı. Daha önce edinilen daha az etkin kazanımların kullanımından kaçınılan bir algoritma tipi. Yani, yeterli zaman ve deneme ile sistem, en iyi hareket şeklinin ne olduğunu kendi kendine belirleyebiliyor. Bu teknik, Google’ın Go şampiyonlarını yenmede kullandığı teknikle aynı.

Alt-görev birimleri

Fakat yeterince kompleks görevler söz konusu olduğunda sıradan bir takviye etmeyi öğrenme sistemi oldukça yavaş kalıyor. Shakespear’in tüm çalışmalarını daktiloda yeniden yazan maymunları düşünün. Bu nedenle Maluuba’nın ekibi görevi, daha küçük alt görevlere ayırmış. Tıpkı hayaletlerden kaçınmak ya da labirent içerisindeki belirli bir hapı yemek gibi. Ve sonra da çözüm yoluna ulaşmaları için her birine 150 paralel sinir ağından biri verilmiş. Ekip daha sonra bu ağ zincirinin tepesine yönetici bir yapay zeka yerleştirmiş ve böylece sürünün faaliyetlerini yönetmeyi ve oyunda galip gelme maksadını gerçekleştirmeye yardımcı olmayı başarmış.

Yönetici yapay zeka her bir alt birim yapay zekanın mevcut senaryo içerisindeki tepkisini alıyor, ölçüp biçiyor ve grup adına bir karar veriyor. Yani, alt birim yapay zekaların yarısı ‘Sağa git, o hapı ye’ derken,bir kaçı ise ‘hayır, yapma, o yolun sonunda hayalet var’ deseler, yönetici yapay zeka ölmeme ihtimalini, hapı yemeye tercih ediyor. Ekip, özgün sistemini ‘Hibrit Ödüllendirme Mimarisi’ olarak tanıtıyor.

Leave A Reply

Lütfen yorumunuzu giriniz!
Lütfen isminizi buraya giriniz

Paylaş

Popular

More like this
Related

Permolit Boya’dan Uzun Ömürlü Sağlam Yalıtım

Permolit Boya’dan Uzun Ömürlü Sağlam Yalıtım Akçalı Boya ve Kimya...

Kara Cuma (Black Friday) çılgınlığı nedir?

Kara Cuma (Black Friday) Şükran Günü’nün (Thanksgiving Day) ertesi sabahında...

BitCoin Nedir? CryptoCurrency Kripto Para Nedir?

BitCoin Nedir? CryptoCurrency Kripto Para Nedir? Bitcoin nedir, Kripto para...

iPhone 8’deki FACE ID özelliği sınırları zorluyor!

iPhone 8’deki Face ID fonksiyonları herkesi şaşırttı Son zamanlarda gündemimizden...