IBM Yapay Zekası Watson ile Ses Etkileşimli VR AR Ortamlarda

IBM, XR’nin geleceği olarak yapay zeka destekli ses etkileşimi üzerine çalışmalarına devam ediyor. IBM, 2021 Unity Technology Trends Report’ta yapay zekanın olgunluğunun el takibinin ötesinde ve ses dünyasında önemli bir rol oynayacağını açıklayarak, yapay zekanın XR deneyimleri için yeni nesil etkileşimi ortaya çıkaracağını öngörüyor.

VR ve AR daha yaygın hale geldikçe ve kullanıcıların beklentilerinin artışıyla kullanım kolaylığı etkileşiminde gördüğümüz son büyük atılım, kurumsal ve tüketici VAR cihazlarında el takibi ve hareket tanımanın lansmanı oldu. Bu yeni bir sorgu tabanlı sesli etkileşimlerini ve hatta konuşma yoluyla dijital ortamlarla etkileşim kurma ve kontrol etme becerisini de içermesi bekleniyor.

Doğal dil işleme, insanlar ve makineler arasındaki gerçekçi konuşmayı güçlendiren bir tür makine öğrenimidir. IBM’in bu alandaki anahtar teknolojisi, yapay zeka asistanı Watson’ın konuşmadaki farklı bileşenleri tanımak için sınıflandırıcıları kullanıyor.

Pavitt Watson’ı, “Bir oyuna [konuşmayı] programladığınızda, halletmeniz gereken 10 amacınız olabilir, ancak kullanıcı soracak sonsuz şeyiniz varmış gibi hissettirirken kendi sesinizi kullanma özgürlüğü de vardır. Tamamen belirsiz bir şey sorsanız bile, onu yine de hikayeyle ve beklediğiniz şeyin akışıyla bütünleşecek şekilde sınıflandırabilirsiniz.” şeklinde açıklıyor.

Pavitt’e AI tabanlı ses etkileşiminin VR oyunlarını nasıl daha çekici hale getireceği konusunda, “Yapay zeka alanında, konuşma arayüzleriyle yaptığımız şeylerin çoğu, dil esnekliği sağlıyor. Üç seçenekten birini seçmek zorunda değilsiniz.”açıklamasını yaparken 2007’de ilk çıktığında gerçekten çığır açan bir açık dünya oyunu olan Mass Effect’in önemini de belirtiyor. Pavitt, sesli etkileşim ile yeni nesil oyunların konuşma tabanlı dilin tanıtımı sayesinde nasıl çok daha kişisel hale geleceğini vurguluyor.

IBM Watson

Watson’ın gerçekten ilgi çeken bir diğer özelliği, doğal dil anlama denen bir süreç olan duygu analizi yapabilme becerisi olarak gösteriliyor. Bu nedenle, kişilik açısından bakıldığında, sadece ne söylendiğini değil, nasıl söylendiğini de anlamaya çalışacaklarını belirtiliyor. Çok basit bir düzeyde, Watson olumlu mu yoksa olumsuz mu bir şey hakkında konuşulduğunu belirleyebilecek.

“İnsanların teknoloji ve verilerle etkileşim kurmasının çok farklı bir yolu. Ve bu kesinlikle gördüğümüz bir şey. Birkaç yıl önce İngiltere’de bir futbol takımıyla bir çalışma yaptık. Onlara konuşma arayüzleri fikrini sunduğumu hatırlıyorum ve bu onların zihniyetlerinde çok farklı bir değişimdi.”

Ses tabanlı etkileşimin, kurumsal uygulamalarda, oyunlarda ve anlatı tasarımında ve ayrıca evlerimizde asistan olarak eğitim ve öğretim için teknikleri nasıl ilerlettiğine dair net örnekler zaten var. Güven çok büyük bir faktör olsa da, VR ve AR, ister gerçek dünyada ister tamamen bilgisayar tarafından oluşturulan ortamlarda olsun, dijital ortamlarda konuşmayı organik olarak normalleştiriyor.

Gamze Pehlivan
Digital Content Writer

Share This

Copy Link to Clipboard

Copy