Saadin Oyucu- Kişisel Web Sayfası

Konuşma Tanıma

Otomatik Konuşma Tanımaya Genel Bakış

Temelde insanların birbirleri ile iletişimini destekleyen teknolojiler zaman içerisinde yapısal olarak değişmiş ve insan-makine etkileşimi kavramı ortaya çıkmıştır [1]. Erken evrelerde basit tuşlu sistemler ile gerçekleştirilen insan makine veya elektronik cihaz etkileşimi günümüzde yerini dokunmatik sistemlere bırakmıştır [2]. Fakat bu durum bile insanların makine veya elektronik cihazlar ile iletişimini sınırlı olarak sağlamaktadır. İnsanların makine veya elektronik cihazlarla ana dillerini konuşarak iletişim kurması, makina veya elektronik cihazların komut ve kontrol mekanizmasının daha hızlı bir şekilde çalıştırabilmesine olanak vermektedir. Bu nedenle Otomatik Konuşma Tanıma (ASR: Automatic Speech Recognition) sistemleri geliştirilmekte ve kullanım alanı her geçen gün artmaktadır.

 

ASR sistemleri sadece sosyal, kültürel ve ekonomik alanda değil aynı zamanda adli ve istihbari alanlarda da yaygın olarak kullanılmaktadır [8]. İstihbari alanda şüpheli şahısların konuşmalarının ASR sistemleri ile metne aktarılması ve bu metinler üzerinde suç analizi yapılması çalışılmaktadır. Yine istihbarat amacıyla terör gruplarına ait karasal, uydu, kablo ve internet üzerinden yapılan radyo ve televizyon yayınlarında geçen konuşmalar ASR sistemleri ile metin haline getirilmektedir. Bu metinler üzerinde kelime yakalama veya büyük veri analizi yapılabilmektedir. Konuşulan ifadenin doğru bir şekilde metne aktarılması ise önem arz etmektedir. Bu nedenle ASR sistemlerinin başarımını arttırmak amacıyla birçok çalışma yapılmıştır. Fakat ASR sistemlerinin başarısı henüz istenilen seviyeye ulaşamamıştır.

 

Yazının devamını için TIKLAYINIZ.

Bir Yorum Ekleyin