Bugünün konuşma tanıma sistemleri, güçlü ve karmaşık istatistiksel modelleme sistemleri kullanır. Bu sistemler en olası sonucu belirlemek için olasılık ve matematiksel işlevlerini kullanabilirsiniz. John Garofolo, Ulusal Standartlar ve Teknoloji Enstitüsü Bilgi Teknolojileri Laboratuarı'nda Konuşma Grup Müdürü göre, bugün domine iki model Saklı Markov Modeli ve sinir ağları vardır. Bu yöntemler, karmaşık matematiksel fonksiyonları içeren, ama aslında onlar ondan gizli bilgileri anlamaya sisteme bilinen bilgiler alır.
Saklı Markov Modeli en yaygın olanıdır, bu yüzden daha yakından göz atacağız Bu süreçte de. Bu modelde, her fonem bir zincirin bir halkası gibidir ve tamamlanan zincir bir kelimedir. Ancak, program olarak farklı yönlere kapalı zincir dalları sonraki gelecek büyük olasılıkla var sesbirim dijital ses eşleştirmeyi dener. Bu süreçte, program dayalı, her fonem bir olasılık puanı atar, built-in sözlük ve kullanıcı eğitimi
Bu süreç daha da karmaşık cümleleri ve cümle için -. Sistem nerede olduğunu anlamaya vardır Her kelime durur ve başlar. Klasik örnek ifade " olduğu; konuşma, " tanımak; hangi " gibi bir çok geliyor; batık güzel bir plaj " çok hızlı bir şekilde söylerken. Program doğru almak için daha önce geldi ifadesini kullanan fonemleri analiz vardır. İşte iki cümleleri bir arıza var:
r eh ao g n ay z s p k iy ch
" " konuşma tanımak;