Utama teknologi

Teknologi pengecaman pertuturan

Teknologi pengecaman pertuturan
Teknologi pengecaman pertuturan

Video: CCTV Pengecaman Wajah 2024, Julai

Video: CCTV Pengecaman Wajah 2024, Julai
Anonim

Pengecaman pertuturan, kemampuan peranti untuk bertindak balas terhadap arahan lisan. Pengecaman pertuturan membolehkan kawalan bebas tangan dari pelbagai peranti dan peralatan (kelebihan bagi banyak orang kurang upaya), memberikan input kepada terjemahan automatik, dan membuat imlak siap cetak. Antara aplikasi awal untuk pengecaman pertuturan adalah sistem telefon automatik dan perisian imlak perubatan. Ini sering digunakan untuk imlak, untuk meminta pangkalan data, dan untuk memberikan perintah kepada sistem berasaskan komputer, terutama dalam profesi yang bergantung pada perbendaharaan kata khusus. Ia juga membolehkan pembantu peribadi kenderaan dan telefon pintar, seperti Apple's Siri.

Sebelum mana-mana mesin dapat menafsirkan ucapan, mikrofon mesti menerjemahkan getaran suara seseorang menjadi isyarat elektrik seperti gelombang. Isyarat ini pada gilirannya ditukar oleh perkakasan sistem — misalnya, kad suara komputer — menjadi isyarat digital. Adalah isyarat digital yang dianalisis oleh program pengecaman pertuturan untuk mengenali fonem yang berasingan, asas asas pertuturan. Fonem kemudian digabungkan menjadi perkataan. Walau bagaimanapun, banyak perkataan serupa, dan, untuk memilih kata yang sesuai, program mesti bergantung pada konteksnya. Banyak program menetapkan konteks melalui analisis trigram, kaedah berdasarkan pangkalan data kelompok tiga perkataan yang kerap di mana kebarangkalian ditugaskan bahawa mana-mana dua perkataan akan diikuti oleh kata ketiga yang diberikan. Contohnya, jika penutur mengatakan "siapa saya", kata berikutnya akan dikenali sebagai kata ganti "I" dan bukan "mata" yang serupa. Walaupun demikian, campur tangan manusia kadang-kadang diperlukan untuk membetulkan kesalahan.

Program untuk mengenali beberapa perkataan yang terpencil, seperti sistem navigasi suara telefon, berfungsi untuk hampir setiap pengguna. Sebaliknya, program ucapan berterusan, seperti program imlak, mesti dilatih untuk mengenali corak pertuturan seseorang; latihan melibatkan pengguna membaca sampel teks dengan kuat. Hari ini, dengan kekuatan komputer peribadi dan peranti mudah alih yang semakin meningkat, ketepatan pengecaman pertuturan telah meningkat dengan ketara. Kadar kesalahan telah dikurangkan menjadi kira-kira 5 peratus dalam perbendaharaan kata yang mengandungi berpuluh-puluh ribu perkataan. Ketepatan yang lebih besar dicapai dalam perbendaharaan kata terhad untuk aplikasi khusus seperti imbasan diagnosis radiologi.