Saadin Oyucu Kişisel Web Sayfası

Genel / Konuşma Tanıma / Teknoloji

Web Service-Based Turkish Automatic Speech Recognition Platform

Web Service-Based Turkish Automatic Speech Recognition Platform

Bu çalışmada Türkçe Otomatik Konuşma Tanıma (ASR) sistemine web servis tabanlı bir yaklaşım ile erişim sağlanmıştır. Çalışma kapsamında Gaussian Mixture Model ve Hidden Markov Model tabanlı bir Türkçe ASR sistemi geliştirilmiştir. ASR sistemine erişimini kolaylaştırmak için bir web servis yapısı oluşturulmuştur. Web servis yapısındaki metotlara ve verilere erişim, Temsili Durum Transferi (REST: Representional State Transfer, RestFul Web Services) web servisleri ile servis katmanı üzerinden sağlanmıştır. Web servis ile etkileşimi sağlayabilmek için bir arayüz geliştirilmiştir. Platform ASR, web servis ve arayüz teknolojileri gibi farklı teknolojiler bir arada kullanılarak geliştirilmiştir. Geliştirilen platform standart bir web tarayıcısı aracılığıyla veya bir Application Programming Interface (API) aracılığıyla kullanılabilmektedir. Sistem performansını arttırmak için tek sunucu üzerinde farklı sanal makineler kullanmak yerine Docker paketleri kullanılmıştır. Gerçekleştirilen deneylerde Türkçe ASR sisteminin %27.70 kelime hata oranına sahip olduğu görülmüştür. Web servis performans testlerinde ise platformun, 59 sn’lik bir konuşma kaydı için ortalama 9,6 saniyede cevap verdiği tespit edilmiştir. Geliştirilen kullanıcı arayüzü hem mobil hem de masaüstü web tarayıcılarında test edilmiş ve sorunsuz çalıştığı görülmüştür. Platformun sağladığı API desteği ile arayüz kullanmaya gerek kalmadan uygulamaların ve diğer servislerin platforma erişimi sağlanmıştır. Böylelikle sayıları gittikçe artan mobil cihazlarda, nesnelerin interneti ekosisteminde veya diğer erişim cihazlarında sorunsuz çalışabilen bir web servis tabanlı Türkçe ASR platform geliştirilmiştir.

Detaylı Bilgi için Tıklayınız

Bir Yorum Ekleyin