Bilgi Keşfi
/ Knowledge Discovery >> Bilgi Keşfi >> teknoloji >> bilgisayar >> internet >> web tasarım geliştirme >>

Uzman Stuff: Google'ın Mike Cohen

Expert Stuff: Google'ın Mike Cohen
Uzman Stuff: Google'ın Mike Cohen

Konuşma Teknolojileri Mike Cohen Google'ın Müdürü çoğumuz hakkında sanmıyorum bir seviyede konuşma anlar. O ses kombinasyonları ve bağlamsal ipuçları temel seviyede anlar. O var - diye konuşma tanıma teknolojisi üzerinde çalışıyor Google'da bir bölüm sorumlusu var

Konuşma zor tanımak için bir bilgisayar öğretmek.. İngilizce anlamak için, bir aşmak gerekir birçok engeller vardır. Fonetik aynı ses ama farklı şeyler anlamına gelen sözler - İngilizce dil homonyms bir yeri vardır. Için, " " düşünün; " iki " ve " de. " Bir aksanıyla veya bölgesel lehçesinde konuşan insanlar standart telaffuz dramatik farklı bir şekilde kelimeleri telaffuz edebilir. Rota " Ve sonra " gibi kelimeler vardır; Alternatif telaffuzlarını var - söylemek ve olabilir quot; kök " veya " hezimet " ve her ikisi de doğrudur.

Nasıl bu ayrımları yapmak için bir bilgisayar öğretmek mı? Nasıl bir makine biz demek ve uygun şekilde yanıt anlayabilirim? Bu zorlukları Cohen ve Google'da ekibi yüzünü vardır. Biz Cohen ile konuştu ve konuşma tanıma, araştırma ve uygulamaları yaptığı iş hakkında daha fazla ayrıntı vermek için sordum.

Her sayfada, başlığında sorularımızı ve vücutta Cohen'in yanıtları görürsünüz. Bir sonraki sayfada göreceğiniz gibi, konuşma tanıma teknolojisi temelleri ile başladı. Temel düzeyde konuşma tanıma teknolojisi nasıl çalışır
?

Tamam, temelde, yol alanda bu yıllardır son birkaç veri tabanlı ya da istatistiksel modelleme yaklaşımları doğru daha aşırı gitti. Ne demek istediğinizi insanlar gitmek ve tüm bu kuralları veya dil nasıl çalıştığını bu tanımlamaların hepsi programlamak için çalışın sahip daha ziyade, biz çok ve modelleri çok sayıda veri ve modelleri yem olabilir modeller oluşturmak için çalıştı verilerden konuşma yapısı hakkında öğreneceksiniz. Yani veri tabanlı yaklaşımlar o miktarda veri besleyerek dilin büyük istatistiki modeller oluşturma dayalı yaklaşımlardır.

Bu ilk prensibi ve makine öğrenimi, veya veri güdümlü ya da istatistiksel yaklaşımlar aslında doğru hareketin var konuşma tanıma alanında tarihinin en önemli gelişmelerden biri. Ve böylece bir soru, biz o zaman biz bir konuşma tanıyıcı dışında iyi bir performans elde edebilirsiniz bu verileri besler o başlamalıyım modelin ne tür olacak? Yapmamız biz temelde ona konuşma sinyalinin bu modeli farklı yönlerini üç temel b

Page [1] [2] [3] [4] [5] [6] [7] [8]