Trollere karşı geliştirilen projede zaaflar açığa çıkarıldı

API online ortamda zehirli dil kullanımını tespit etmesi için yapılmıştı fakat sistemde bazı açıklar söz konusu

Yazar

05 Mart 2017

518

Yapay zeka kullanılarak rahatsız edici söylemler filtreleniyor

“Yorumlar bölümünü okuma” kuralı, internetin başlıca kurallarından biri. Zira genellikle zehirli dilin ve tacizkar yazıların yatakları durumunda olan yorumları okuyup da aydınlanarak çıkan pek vaki değildir. Alphabet’in alt şubesi olan Jigsaw, Perspective isimli proje dahilinde rahatsızlık verici söylemlerle mücadele etmek için faaliyet gösteriyor. Perspective, online ortamda saldırganlığı tespit etmek için yapay zeka kullanan bir API. Fakat bazı araştırmacılar sistemi kandırmanın ne denli kolay olduğunu keşfettiler.

Perspective, münazara üzerindeki olası tahmini etkiye dayalı olarak yorumlara ‘zehirlilik puanlaması’ atfeder. Örneğin; ‘Aptalca ve yanlış!’ yazdığınız zaman Perspective bu cümleyi yüzde 89 oranında ‘Zehirli’ olarak değerlendirir. Bununla birlikte Washington Üniversitesi Güvenlik Laboratuvarından bazı araştırmacılar bu API’nin, yazılan metinleri kurnazca değişikliğe uğratmanın zehirlilik oranını kalıcı biçimde düşürmesini sağlayacak şekilde yanıltılabileceğini buldular. Kasti olarak yazıları yanlış yazan araştırmacılar (idiot yerine ‘iidiot’ yazarak) kelimelerin aralarına noktalama işaretleri de koydular (‘stu.pid’ ya da ‘s c r e w’). Aynı zamanda ‘Aptalca ve yanlış değil’ yazmanın, taciz içerikli mesajlarla aynı oranda rahatsız edici olarak puanlandığını gördüler.

Ars Technia tarafından yapılan bir haberdeki söylemde Perspective’in proje müdürü CJ Adams, çalışmayı övmüş ve şunları söylemişti :

“Bu tip araştırmaları görmek çok hoş. Online saldırganlık üstesinden gelinmesi zor bir sorun ve Perspective tartışma ve yorumların değerlendirmesinde Yapay Zekanın ne şekilde kullanılabileceğini keşfetmek için destek sağlamak üzere geliştirilmişti. Akademik araştırmacıları Github’daki araştırma çalışmalarımıza katılmalarını ve mevcut modelin eksikliklerini birlikte nasıl tespit edebileceğimizi ve bunları geliştirmenin yollarını beraberce bulmayı isteriz.

Perspective henüz oldukça erken aşamada olan bir teknoloji ve bazı araştırmacıların doğru şekilde belirttikleri gibi sadece daha önce görülmüş olan rahatsız edici mesaj örneklerinin benzerleri olan modelleri tespit edebilir. Bu zorlu çalışmayla ve diğer sorunlarla ilgili ‘Conversation AI (Yapay zeka sohbeti)’ araştırma sayfasında daha fazla detay mevcut. API, araştırmacıların ve kullanıcıların düzeltmeler göndermelerine olanak tanıyor. Böylece modelin geliştirilmesi için kullanılabilir ve diğer ‘zehirli’ dil biçimlerini anlaması ve zaman içerisinde yeni biçimler belirdikçe evrimleşerek gelişmesi sağlanabilir.”

Görünen o ki web siteleri Perspectiv’i yorumlar bölümünde uygulamaya koymadan önce biraz daha beklemeleri gerekecek.

Yapay zeka kullanılarak rahatsız edici söylemler filtreleniyor

Leave a reply