Google A.I. (artificial intelligence) dudaklarınızı sizden daha iyi okuyacak
Google A.I. (yapay zeka) dudak okuma için çalışıyor. Google yapay zeka, dudak metnini sizden daha iyi okumayı öğrenmek için binlerce saat TV izledi. Google’ın İngiltere merkezli yapay zekâ bölümü DeepMind’dan araştırmacılar, dünyanın en iyi dudak okuma yazılımını geliştirmek için Oxford Üniversitesi’nden bilim adamlarıyla işbirliği yaptı, muhtemelen dudakları sizden daha iyi okuyacak.
Bunu başarmak için araştırmacılar BBC’den saatlerce TV görüntülerini bir sinir ağıyla beslediler ve ağız hareket analizine dayanan videoları %46.8 doğrulukla açıklamaya çalıştılar. Sonuçta profesyonel bir dudak okuyucusudan dört kat daha etkili olduğunu kanıtladı.
Araştırma, Oxford Üniversitesi tarafından yayınlanan LipNet adlı dudak okuma uygulamasına benzer teknikler kullanıyor. Daha önce yayınlananmış ancak %90’ın üzerinde doğruluklu basit cümlelerle konuşan gönüllülerin video kayıtlarını okuyan çalışmasına dayanıyor.
Bununla birlikte, Oxford’un programının aksine, DeepMind’ın “İzle, Dinle, Bekle ve Hecele” olarak adlandırılan yazılımı eğitildi. Daha zorlu videolarda test edildi. Bu süreçte Google’ın sinir ağı Newsnight, Question Time ve The World Today gibi popüler TV şovlarından 5.000 saatlik görüntü izledi. Videolar 110.000’den fazla farklı cümleyi ve yaklaşık 17.500 benzersiz kelimeyi içeriyor. LipNet toplam 51 benzersiz kelime okudu.
Google araştırmacılarına göre bu eserin amacı, sesli veya sansürsüz, konuşan bir yüz tarafından konuşulan cümleleri tanımaktır. Sınırlı sayıda kelimeyi veya cümleyi tanımaya odaklanan önceki eserlerden farklı olarak, kısıtlamasız tanımlaması zor videolardaki doğal dudak okumasının genel bir dünya sorununu çözmektir.
Derin Zihin, işitme özürlü bireylere yararlı olmasının yanı sıra, yeni geliştirilen yazılımın, filmleri açıklama ve Siri ve Alexa gibi dijital asistanlara basitçe dudak hareketleri kullanarak iletişim kurmanın da dâhil olduğu geniş bir uygulama yelpazesini de destekleyebileceğini söylüyor.