Google : un système de reconnaissance vocale en mode déconnecté

Google a conçu un nouveau dispositif de reconnaissance vocale, lequel fonctionne en mode déconnecté et serait plus performant que ceux actuellement disponibles sur le marché.

En lançant Google Now en mai 2013, Google avançait que cet assistant pouvait également fonctionner sans connexion Internet. Toutefois, les options sont assez limitées. Il est par exemple possible de lire de la musique, d’ouvrir Gmail, d’activer ou de désactiver le mode avions ou les connexions Wi-Fi et Bluetooth ou encore de gérer le volume.

Une équipe d’ingénieurs de Google a récemment publié leurs travaux de recherche pour la mise en place d’un nouveau dispositif (PDF). Google fait usage de diverse techniques de machine learning et il en résulterait un traitement des requêtes 7 fois plus rapide que sur un assistant nécessitant une infrastructure de cloud computing.

Pour une dictée classique, ce nouveau système aurait pour l’heure un taux d’erreur de 13,5%. Ces travaux ont été testés sur un Nexus 5 disposant d’un SoC quad core cadencé à 2,26 GHz avec 2 Go de mémoire vive. L’application pèse un peu plus de 20 Mo. Pour en réduire au maximum sa taille, les chercheurs ont rassemblé en un seul module la dictée et les commandes vocales. En outre Google fait usage de plusieurs techniques de compression.

Google Now ban

Pour entraîner cet algorithme, les chercheurs ont fait usage de quelque 3 millions de voix anonymes (soit environ 2000 heures). Chacun des échantillons a en outre subi une vingtaine de distorsions.

Notons qu’en début de mois Google a signé un partenariat avec Movidius afin de concevoir un système de reconnaissance d’images et de visages fonctionnant également en mode déconnecté. Dans ce cas de figure les calculs des algorithmes seront aussi effectués en local.

Modifié le 14/03/2016 à 10h25

Go to Source


bouton-devis