YouTube otomatik ses efekti altyazısı ekliyor

Otomatik Altyazı sistemi

YouTube’da artık videolardaki müzik, ses ve kahkahayı otomatik olarak tanımlayan ‘ses efekti alt yazı sistemi’ var.

Bu, küçük fakat, Google’ın alt kuruluşu olan ve internet’in sıklıkla uğranan yayın sitesinin erişilebilirlik özelliklerine yapılmış belirgin bir eklenti. YouTube, Google’ın ses tanıma özelliğine dayalı olarak diyalog kayıtları için sunduğu otomatik alt yazı hizmeti 2009 yılından beri mevcut. Fakat ses efektlerini altyazılandırmak çok daha zor ve geçtiğimiz birkaç yıl içerisinde yer alan makine öğrenimindeki (yapay zeka) gelişmelerle başarılabilecek bir iş.

[irp posts=”8349″ name=”YouTube’daki otomatik altyazılı video sayısı 1 milyarı aştı”]

Sorun, bir bilgisayarın bazı şeyleri tespit ederek bunları sınıflandırmada göstereceği beceriden çok (Google Fotoğraflar gibi ürünler halihazırda örneğin resimler için algılama kapasitesine sahip), sesleri tanımlayacak olan nöral ağın eğitimi esnasında kullanılacak olan ses efektleri için belirgin bir veri tabanının olmayışı.

Google’da mühendis olan Sourish Chaudhuri bir blog gönderisinde “Tanımlı* çevre sesi bilgisini edinmek zor olmakla birlikte, zayıf biçimde tanımlandırılmış veri kullanarak makine eğitimi için yeterince büyük bir veri seti üretebildik” dedi.  Ekip öncelikle müzik, ses ve kahkaha üzerinde odaklanmaya karar vermiş zira bunlar bir video diyaloğuna sağır ya da işitme güçlüğü çekenler için anlamlı bağlantılar eklerler.

YouTube binlerce saatlik video işleme sürecinden sonra, ‘America’s Got Talent’ (yukarıdaki videoda CC butonuna basarak alt yazıları aktive edebilirsiniz) filminden alınma bu klipte olduğu gibi videolarda ses efektleri için aktive edebileceğiniz eğitilmiş yapay zeka algoritmasına sahip oldu. Google mühendisi Noah Wang’a göre iş henüz bitmedi.

Wang yazısına devamla ;

“Gelecekteki uğraşılarımız önemli sorunları beraberinde getiren (örneğin; zil sesi ile ilgili olarak bunun bir saat alarmı mı, kapı zili mi yoksa telefon zili mi olduğunu ayırd edebilme zorunluluğumuz olacak) zil sesi, havlama sesi ve kapıya tıklama sesi gibi diğer genel ses sınıflarını da bu çalışmaya eklemeyi içerebilir” dedi.

Tanımlı Veri : Resim, müzik, video gibi materyallerden elde edilen veriler üzerinde herhangi bir bilgi mevcut değilse (örneğin müziği kimin söylediği, resimlerde kimlerin olduğu, v.b.) bu materyaller ‘Tanımsız Veri’ (Unlabelled Data) sınıfına girerler. Materyal ile ilgili az ya da detaylı bilgi girişinin olduğu materyaller ise ‘Tanımlı veri’ (Labelled Data) olarak adlandırılırlar.

Otomatik Altyazı sistemi

YouTube’da artık videolardaki müzik, ses ve kahkahayı otomatik olarak tanımlayan ‘ses efekti alt yazı sistemi’ var.

Bu, küçük fakat, Google’ın alt kuruluşu olan ve internet’in sıklıkla uğranan yayın sitesinin erişilebilirlik özelliklerine yapılmış belirgin bir eklenti. YouTube, Google’ın ses tanıma özelliğine dayalı olarak diyalog kayıtları için sunduğu otomatik alt yazı hizmeti 2009 yılından beri mevcut. Fakat ses efektlerini altyazılandırmak çok daha zor ve geçtiğimiz birkaç yıl içerisinde yer alan makine öğrenimindeki (yapay zeka) gelişmelerle başarılabilecek bir iş.

[irp posts=”8349″ name=”YouTube’daki otomatik altyazılı video sayısı 1 milyarı aştı”]

Sorun, bir bilgisayarın bazı şeyleri tespit ederek bunları sınıflandırmada göstereceği beceriden çok (Google Fotoğraflar gibi ürünler halihazırda örneğin resimler için algılama kapasitesine sahip), sesleri tanımlayacak olan nöral ağın eğitimi esnasında kullanılacak olan ses efektleri için belirgin bir veri tabanının olmayışı.

Google’da mühendis olan Sourish Chaudhuri bir blog gönderisinde “Tanımlı* çevre sesi bilgisini edinmek zor olmakla birlikte, zayıf biçimde tanımlandırılmış veri kullanarak makine eğitimi için yeterince büyük bir veri seti üretebildik” dedi.  Ekip öncelikle müzik, ses ve kahkaha üzerinde odaklanmaya karar vermiş zira bunlar bir video diyaloğuna sağır ya da işitme güçlüğü çekenler için anlamlı bağlantılar eklerler.

YouTube binlerce saatlik video işleme sürecinden sonra, ‘America’s Got Talent’ (yukarıdaki videoda CC butonuna basarak alt yazıları aktive edebilirsiniz) filminden alınma bu klipte olduğu gibi videolarda ses efektleri için aktive edebileceğiniz eğitilmiş yapay zeka algoritmasına sahip oldu. Google mühendisi Noah Wang’a göre iş henüz bitmedi.

Wang yazısına devamla ;

“Gelecekteki uğraşılarımız önemli sorunları beraberinde getiren (örneğin; zil sesi ile ilgili olarak bunun bir saat alarmı mı, kapı zili mi yoksa telefon zili mi olduğunu ayırd edebilme zorunluluğumuz olacak) zil sesi, havlama sesi ve kapıya tıklama sesi gibi diğer genel ses sınıflarını da bu çalışmaya eklemeyi içerebilir” dedi.

Tanımlı Veri : Resim, müzik, video gibi materyallerden elde edilen veriler üzerinde herhangi bir bilgi mevcut değilse (örneğin müziği kimin söylediği, resimlerde kimlerin olduğu, v.b.) bu materyaller ‘Tanımsız Veri’ (Unlabelled Data) sınıfına girerler. Materyal ile ilgili az ya da detaylı bilgi girişinin olduğu materyaller ise ‘Tanımlı veri’ (Labelled Data) olarak adlandırılırlar.

More from author

Leave A Reply

Lütfen yorumunuzu giriniz!
Lütfen isminizi buraya giriniz
Captcha verification failed!
Captcha kullanıcı puanı başarısız oldu. lütfen bizimle iletişime geçin!

Related posts

Advertismentspot_img

Latest posts

Permolit Boya’dan Uzun Ömürlü Sağlam Yalıtım

Permolit Boya’dan Uzun Ömürlü Sağlam Yalıtım Akçalı Boya ve Kimya San. Tic. A.Ş.'nin en önemli markalarından biri olan Permolit Boya, tüketicilerin ihtiyaçlarına uygun geliştirdiği elyaflı...

YouTube reklamlarında CoinHive JavaScript kripto madencilik kodu tespit edildi

YouTube reklamlarında CoinHive JavaScript kripto madencilik kodu tespit edildi Yeni bir rapora göre, bazı ülkelerde yayınlanan bazı YouTube reklamları, hackerlar tarafından, video izleyicilerinin bilgisayarlarının işlem...

Kara Cuma (Black Friday) çılgınlığı nedir?

Kara Cuma (Black Friday) Şükran Günü’nün (Thanksgiving Day) ertesi sabahında gerçekleşen bir alışveriş çılgınlığıdır. Kara Cuma bu yıl 25 Kasım tarihine denk gelmektedir. Ünlü markalar Kara Cuma’da %80’e varan indirimler...
[tdn_block_newsletter_subscribe title_text="Want to stay up to date with the latest news? " description="V2UlMjB3b3VsZCUyMGxvdmUlMjB0byUyMGhlYXIlMjBmcm9tJTIweW91ISUyMFBsZWFzZSUyMGZpbGwlMjBpbiUyMHlvdXIlMjBkZXRhaWxzJTIwYW5kJTIwd2UlMjB3aWxsJTIwc3RheSUyMGluJTIwdG91Y2guJTIwSXQncyUyMHRoYXQlMjBzaW1wbGUh" input_placeholder="Email address" btn_text="Subscribe" tds_newsletter2-image="8" tds_newsletter2-image_bg_color="#c3ecff" tds_newsletter3-input_bar_display="row" tds_newsletter4-image="9" tds_newsletter4-image_bg_color="#fffbcf" tds_newsletter4-btn_bg_color="#f3b700" tds_newsletter4-check_accent="#f3b700" tds_newsletter5-tdicon="tdc-font-fa tdc-font-fa-envelope-o" tds_newsletter5-btn_bg_color="#000000" tds_newsletter5-btn_bg_color_hover="#4db2ec" tds_newsletter5-check_accent="#000000" tds_newsletter6-input_bar_display="row" tds_newsletter6-btn_bg_color="#da1414" tds_newsletter6-check_accent="#da1414" tds_newsletter7-image="10" tds_newsletter7-btn_bg_color="#1c69ad" tds_newsletter7-check_accent="#1c69ad" tds_newsletter7-f_title_font_size="20" tds_newsletter7-f_title_font_line_height="28px" tds_newsletter8-input_bar_display="row" tds_newsletter8-btn_bg_color="#00649e" tds_newsletter8-btn_bg_color_hover="#21709e" tds_newsletter8-check_accent="#00649e" embedded_form_code="JTNDIS0tJTIwQmVnaW4lMjBNYWlsQ2hpbXAlMjBTaWdudXAlMjBGb3JtJTIwLS0lM0UlMEElMEElM0Nmb3JtJTIwYWN0aW9uJTNEJTIyaHR0cHMlM0ElMkYlMkZ0YWdkaXYudXMxNi5saXN0LW1hbmFnZS5jb20lMkZzdWJzY3JpYmUlMkZwb3N0JTNGdSUzRDZlYmQzMWU5NGNjYzVhZGRkYmZhZGFhNTUlMjZhbXAlM0JpZCUzRGVkODQwMzZmNGMlMjIlMjBtZXRob2QlM0QlMjJwb3N0JTIyJTIwaWQlM0QlMjJtYy1lbWJlZGRlZC1zdWJzY3JpYmUtZm9ybSUyMiUyMG5hbWUlM0QlMjJtYy1lbWJlZGRlZC1zdWJzY3JpYmUtZm9ybSUyMiUyMGNsYXNzJTNEJTIydmFsaWRhdGUlMjIlMjB0YXJnZXQlM0QlMjJfYmxhbmslMjIlMjBub3ZhbGlkYXRlJTNFJTNDJTJGZm9ybSUzRSUwQSUwQSUzQyEtLUVuZCUyMG1jX2VtYmVkX3NpZ251cC0tJTNF" tds_newsletter="tds_newsletter1" tds_newsletter1-input_bar_display="" tds_newsletter1-input_border_size="0" tds_newsletter1-title_color="#172842" tds_newsletter1-description_color="#90a0af" tds_newsletter1-disclaimer_color="#90a0af" tds_newsletter1-disclaimer2_color="#90a0af" tds_newsletter1-input_text_color="#90a0af" tds_newsletter1-input_placeholder_color="#bcccd6" tds_newsletter1-input_bg_color="#ffffff" tds_newsletter1-input_border_color="rgba(255,255,255,0)" tds_newsletter1-input_border_color_active="rgba(255,255,255,0)" tds_newsletter1-f_title_font_family="394" tds_newsletter1-f_title_font_size="eyJhbGwiOiI0MiIsImxhbmRzY2FwZSI6IjM2IiwicG9ydHJhaXQiOiIzMCIsInBob25lIjoiMzAifQ==" tds_newsletter1-f_title_font_line_height="1.2" tds_newsletter1-f_title_font_spacing="-1" tds_newsletter1-f_descr_font_family="638" tds_newsletter1-f_descr_font_size="eyJhbGwiOiIxOCIsImxhbmRzY2FwZSI6IjE1IiwicG9ydHJhaXQiOiIxNCIsInBob25lIjoiMTQifQ==" tds_newsletter1-f_descr_font_line_height="1.6" tds_newsletter1-f_descr_font_weight="700" content_align_horizontal="content-horiz-center" tdc_css="eyJhbGwiOnsibWFyZ2luLXJpZ2h0IjoiYXV0byIsIm1hcmdpbi1ib3R0b20iOiIxMDAiLCJtYXJnaW4tbGVmdCI6ImF1dG8iLCJwYWRkaW5nLXRvcCI6IjkwIiwid2lkdGgiOiI0MCUiLCJkaXNwbGF5IjoiIn0sInBvcnRyYWl0Ijp7Im1hcmdpbi1ib3R0b20iOiI3MCIsInBhZGRpbmctdG9wIjoiNjAiLCJ3aWR0aCI6IjcwJSIsImRpc3BsYXkiOiIifSwicG9ydHJhaXRfbWF4X3dpZHRoIjoxMDE4LCJwb3J0cmFpdF9taW5fd2lkdGgiOjc2OCwicGhvbmUiOnsibWFyZ2luLWJvdHRvbSI6IjcwIiwicGFkZGluZy10b3AiOiI2MCIsIndpZHRoIjoiMTAwJSIsImRpc3BsYXkiOiIifSwicGhvbmVfbWF4X3dpZHRoIjo3NjcsImxhbmRzY2FwZSI6eyJtYXJnaW4tYm90dG9tIjoiOTAiLCJwYWRkaW5nLXRvcCI6IjgwIiwid2lkdGgiOiI2NSUiLCJkaXNwbGF5IjoiIn0sImxhbmRzY2FwZV9tYXhfd2lkdGgiOjExNDAsImxhbmRzY2FwZV9taW5fd2lkdGgiOjEwMTl9" tds_newsletter1-f_disclaimer_font_family="394" tds_newsletter1-f_disclaimer2_font_family="394" tds_newsletter1-f_input_font_family="394" tds_newsletter1-f_input_font_line_height="3" tds_newsletter1-f_input_font_size="eyJhbGwiOiIxNiIsInBvcnRyYWl0IjoiMTQiLCJwaG9uZSI6IjE0In0=" tds_newsletter1-f_btn_font_family="394" tds_newsletter1-f_btn_font_transform="uppercase" tds_newsletter1-f_btn_font_weight="700" tds_newsletter1-btn_bg_color="#e2687e" tds_newsletter1-btn_bg_color_hover="#172842" tds_newsletter1-f_input_font_weight="" tds_newsletter1-f_title_font_weight="800"]