Reconocedor de Voz

Reconocedor de Voz Automatizado de LumenVox (ASR)

El Reconocedor de Voz Automatiza de LumenVox (ASR) es una solución de software que convierte sonido hablado a texto, brindándole la oportunidad a sus usuarios a tener aportaciones más eficientes. Perderá menos tiempo en aportaciones de datos lo cual liberara mas recursos para que sean utilizados con mas eficacia.

Un Reconocedor de Voz compara las aportaciones habladas a una lista de frases para ser reconocidas, llamada gramática. La gramática es usada para restringir la búsqueda, habilitando al ASR a regresar el texto que representa la mejor opción. Este texto es usado para dirigir los siguientes pasos de su aplicación habilitada con voz.

Uno de los usos más comunes para la tecnología de reconocimiento de voz es para los sistemas Respuesta de Voz Interactiva (IVR), lo cual habilita la comunicación entre computadoras y humanos a través de voz. Si alguna vez tuvo que "Decir el nombre de alguna persona con la que quería hablar..." usted ha usado la tecnología de reconocimiento de voz en un IVR.

Nuestro ASR esta integrado con más de 25 plataformas de voz. Los desarrolladores pueden escribir aplicaciones usando nuestra interfase de programación de aplicaciones (API) o una solución estandarizada como el protocolo de control de recursos de media (MRCP). Esto hace que la instalación, implementación y despliegue se le faciliten a los usuarios usando nuestras plataformas.

El Reconocedor de Voz de LumenVox también respalda aplicaciones de Entendimiento de Lenguaje Natural (NLU) a través del desarrollo de Modelos de Leguaje Estadísticos (SLM). Estas técnicas avanzadas de desarrollo de aplicaciones de voz le otorgan una interfase con una voz mas natural para el ASR.

Disponible en versiones de 32 y 64-bits de Linux y Windows, el Reconocedor de Voz independiente de hardware le da vida a soluciones de voz y plataformas desplegadas en ambientes empresariales y SMB mundialmente.

Idiomas Respaldados

  • Ingles Norte Americano
  • Ingles Australiano/Nueva Zelanda
  • Ingles Británico
  • Español Mexicano
  • Español Colombiano
  • Francés Canadiense
  • Portugués Brasileño

También respalda la recomendación W3C's de Interpretación Semántica para Reconocimiento de Voz (SISR), la Especificación de Gramática de Reconocimiento de Voz (SRGS) y Lenguaje Markup de Voz Extensible (VXML). Los desarrolladores que están familiarizados con estándares industriales como este serán capaces de crear aplicaciones rápidamente y con alta efectividad.

El Reconocedor de Voz es distinto a otras soluciones de voz. No provee dictado o verificación de voz. Otros software de reconocimiento de voz solo determinan quién eres; no lo que estas diciendo. Nuestra tecnología es una solución independiente al hablante. Cualquier persona le puede hablar a nuestro Reconocedor y nuestro software reconocerá el sonido hablado y lo convertirá en frases de gramática.

Como Funciona la Tecnología de Reconocimiento de Voz

Los Mecanismos de Voz usan este proceso para averiguar lo que dijo el interlocutor:

  1. El mecanismo carga una lista con palabras para ser reconocidas. Esta lista se llama gramática.
  2. El sonido del interlocutor es capturado por un micrófono o teléfono. Este audio es convertido a una forma de onda, una representación matemática del sonido.
  3. El mecanismo observa las funciones — características distintas de sonido — derivadas de la forma de onda y las compara con su modelo acústico propio. El mecanismo busca el espacio acústico, usando la gramática para guiar la búsqueda.
  4. Después determina que palabras coinciden con las de la gramática y genera un resultado.

 

Como Funciona la Tecnología de Reconocimiento de Voz

 

Tenemos una documentación extensa en nuestro Reconocedor y sus usos en las secciones de Recursos, Documentación de Ayuda o directamente con nuestros departamentos de Ventas o Soporte.

El Mecanismo de Voz compara el audio con las gramáticas cargadas para producir texto reconocido.