Yeni strateji daha kolay, daha hızlı ve daha esnek.
Sinir ağlarını eğitmek kolay bir iş değil. Bu ağlarla işlem yapmak çok zor olmasa bile ne kadar işlemci gücü kullanırsanız kullanın, onları kullanıma hazır hale getirmeniz saatlerinizi alabilir. Bunun için OpenAI araştırmacılarının olağan kuralları unutturacak bir çözümü var. Daha güçlü AI sistemleri vadeden bir evrim stratejisi geliştirdiler. Tabi ki bu evrim bildiğimizi biyolojik evrimle alakalı bir konu değil. Standart takviye eğitimini kullanmak yerine, çevrenin ve sinir ağlarının dahil edildiğini unuttukları bir “kara kutu” yaptılar. Bütün olay belirli bir işlevi yalın olarak optimize etmek ve gerektiğinde bunun paylaşımını sağlamak.
Sistem bir kaç rastgele parametre ile başlıyor, tahminler yürütüyor ve daha başarılı adayları desteklemek için tahminlerine devam tahminlerini ekliyor. Bu sayede başarılı bir şekilde ideal cevaba ulaşmak adına ihtimalleri azaltıyor. Milyonlarca numara ile sürece başlayabilirsiniz ama sadece bir numara ile sona geliyorsunuz.
Kulağa biraz gizemli gelebilir ancak faydaları bariz bir şekilde ortada. Bu teknik geleneksel ve zahmetli olan bir çok sinir ağı eğitim metotlarını ortadan kaldırıyor. Kodun işlenmesini kolaylaştırırken hızını da 2 ila 3 kat arasında arttırıyor. Ve bu plandaki ‘işçiler’ birbiri ile çok az miktarda bilgi paylaşımında bulunuyorlar ve metot siz ne kadar işlemci çekirdeği ile işe girişirseniz girişin nazik bir şekilde hepsini ölçeklendiriyor. Testlerde, 1440 çekirdekli bir süperbilgisayar tipik kuruluşla 10 saatte ikna edilen bir humanoid’i (insansı robot) 10 dakikada yürümeye ikna ediyor. 32 çekirdekli işlemcinin bir tam günde yaptığı işlemi, daha düşük işlemci gücü olan 720 çekirdekli sistem dahi 1 saatte gerçekleştirebiliyor.
Yapay zeka konsepti içerisine giren bu “kara kutu” yaklaşımının getirdiklerini görmek için önümüzde daha uzun bir zaman var. Şu da var ki uygulanabilir işlemler gayet net; sinir ağı operatörleri sistemlerini eğitmeden kullanmaya çalışırsa çok daha fazla vakit harcıyorlar. Ve bilgisayarların giderek daha da hızlandıklarını düşünecek olursak bu tip bir öğrenme gerçek zamanlı olarak da gerçekleşmesi kaçınılmaz gibi duruyor. Yakın zamanda yaptıklarından ders çıkartıp bir sonraki hareketlerinde bu derslerden öğrendiklerini kullanan robotları hayatımızda göreceğimizi söyleyebiliriz.