Audio-visual speech recognition

Audio visual speech recognition (AVSR) nyaéta hiji tehnik nu maké kamampuh image processing dina lip reading pikeun mantuan sistim speech recognition dina mikawanoh telepon nu teu tangtu atawa méré pangaruh nu leuwih gedé di antara kaputusan-kaputusan nu ampir mungkin.

Unggal lip reading sistim jeung speech recognition gawe papisah tuluy hasilna dihijikeun dina tahap feature fusion.

Tumbu luar édit