Es unos de los pilares en el que muchos afirman crecerán las distintas plataformas en el futuro inmediato. Nada de interactuar con comandos escritos o gestos. El futuro está en hablar con las máquinas pero nada de hacerlo con comandos "robóticos" y órdenes antinaturales. Lo haremos con un lenguaje natural, algo que cada vez apreciamos con más claridad en los asistente personales.
Y una de las firmas que cuenta con una carrera más notable en este sentido es Microsoft, una empresa que cuenta con una vía de desarrollo en la que se trabaja en mejorar de forma constante el reconocimiento de voz empleado luego en sus plataformas. Una tecnología de la que tenemos ahora noticias por parte del equipo de desarrollo, noticias que hablan sobre una gran mejora que la sitúan al mismo nivel de precisión que la que es usada entre humanos.
En este sentido han anunciado que su sistema de reconocimiento de voz ha llegado a alcanzar el 5,1% en WER, esto es, el error en la tasa de palabra empleada. Puede que para muchos esto no diga nada, pero asombra si vemos como por un lado esta tasa es la misma que la que encontramos en la comunicación entre las personas.
Para ello desde Redmond han optado por hacer uso de modelos mejorados de lenguaje verbal y acústico basado en el uso de redes neuronales. Estos se combinan con la memoria bidireccional a largo plazo de forma que se mejora el modelado acústico mejorando así el reconocimiento gracias a una predicción de las palabras que pueden ser usadas en base a un historial de comunicaciones. Estas mejoras además cuentan con el apoyo en la nube gracias al esfuerzo que desde la empresa han realizado para mejorar la infraestructura de computación en nube, sobre todo con Azure.
Además, esto ha hecho que esta tasa de error se haya visto rebajada en cuanto al margen de fallo, pues antes se situaba en un 5,9%, bajando así desde un 12% que era la cifra con la que contaba en sistema hace menos de un año. Por lo tanto, Microsoft ha logrado un sistema de reconocimiento de voz tan efectivo como el de los humanos y viendo la progresión que llevan no es de extrañar que incluso lo mejoren en los próximos meses o años.
Quién sabe si de aquí a unos años hablar con nuestro PC con Windows, interactuar con Cortana, o aplicaciones cómo Office, será algo tan natural como lo que ya nos han hecho soñar (o tener pesadillas, quién sabe) en el cine.
Fuente | Microsoft
En Xataka | No son voces de ultratumba, son comandos ocultos que los asistentes de voz reconocen y los humanos no
Ver 1 comentarios