+1(858) 707-7700
| english | Mapa de Sitio | Iniciar sesión

Motor del habla

Contacto
Contact LumenVox Llámenos hoy para saber más.
Demostraciones telefónicas
¡Llame a nuestra línea directa de demostración! Speech Recognition Demo
Speech Recognition Nav Cap

Resultados NBest

n-best Results En lugar de dar sólo el resultado más alto, puede ordenarle al motor del habla que brinde varios de los resultados más altos, las respuestas más probables, a menudo llamadas resultados NBest. Dar los resultados NBest es especialmente efectivo cuando las personas que llaman necesitan deletrear nombres, direcciones de calles o direcciones de correos electrónicos. Sin los resultados NBest, si una persona que llama deletrea un nombre que comienza con "N", pero el motor da un resultado dudable, a la persona que llama se le pediría que repita la letra, y dada la similitud entre "N" y "M", es probable que la segunda respuesta tenga un resultado similar de poca confianza. Con los resultados NBest, el sistema puede preguntarle a la persona que llama utilizando varios de los resultados probables, como "¿Quiso decir 'M', como en 'María'?" Cuando la persona que llama responde "No", el sistema pasa a la siguiente opción: "¿Tal vez quiso decir 'N', como en 'Nancy'?"

La devolución de resultados NBest mejora la experiencia de la persona que llama: en lugar de pedirle a la persona que llama que simplemente repita una respuesta que recibió un resultado de baja confianza, el sistema de reconocimiento del habla puede confirmar la intención de la persona que llama utilizando varias opciones probables.

La estrategia corporativa y de los productos de LumenVox está sincronizada con nosotros

Vern Baker, president of enGenic Corporation

Gramática del servidor

Server Side Speech Grammars LumenVox ofrece una compatibilidad aun más eficiente con las gramáticas amplias de reconocimiento del habla, al permitirles a los clientes cargar con anterioridad las gramáticas en el servidor. Esto les permite a los usuarios enviar la gramática antes de decodificar las peticiones.

Detección de actividad de voz

Voice Activation Detection Generalmente, la gramática misma acompaña cada petición de decodificación, pero en el caso de las gramáticas amplias, es más eficiente enviar la gramática al servidor antes de decodificar; lo que disminuye el tráfico de la red.

La detección de actividad de voz (VAD), también llamada detección de interrupción y/o final del habla (EOS), detecta cuando una persona comienza a hablar, termina de hablar o se detiene mientras habla.

La implementación de VAD de LumenVox proporciona un alto rendimiento a pesar de las condiciones desafiantes: siseos, chasquidos, cambios abruptos en el ruido de fondo, eco en la línea telefónica y chillido de una comunicación de radio de dos vías.

El módulo de detección de actividad de voz es altamente configurable y puede adaptarse para trabajar correctamente dentro de aplicaciones telefónicas, VoIP o en aplicaciones basadas en micrófonos.


Módulo de reducción del ruido:

Speech Engine Truck Demo Las formas de onda de la parte de abajo demuestran la potencia del módulo de reducción del ruido de LumenVox. En el audio original un conductor de un camión está hablando por un teléfono celular mientras conduce. Además del ruido del motor del camión y el soplido del viento, se pone en marcha un motor de otro vehículo en el medio de la grabación.
Noise Reduction Module Cuando hay ruido, éste degradará el rendimiento de cualquier sistema de reconocimiento del habla. La reducción del ruido de calidad mejora la precisión de la detección por activación de voz y el reconocimiento central, ambos son partes fundamentales del sistema de reconocimiento del habla.

Para mejorar la solidez de la aplicación en entornos ruidosos, LumenVox implementó un módulo de reducción del ruido (NRM) en nuestro motor de reconocimiento del habla. El NRM se adapta automáticamente al entorno acústico y actualiza de manera dinámica su cálculo de los niveles de ruido. El algoritmo adaptable permite y actualiza dinámicamente su cálculo de los niveles de ruido. El algoritmo adaptable le permite al NRM reducir los efectos del ruido.

Technical Requirements

Windows
  • Windows NT 4.0 with Service Pack 6a
  • Windows 2000
  • Windows XP Pro
  • Windows 2003
  • Intel Pentium 800MHz or greater / 1 GB RAM
  • 200 MB HD (1-n GB for logs)
Windows Icon
Linux
  • Red Hat Enterprise Server 4, Fedora Core 3 and 4, rPath Linux
  • Intel Pentium 800 Mhz or greater
  • 1 GB RAM
  • 200 MB HD (1-n GB for logs)
Linux Icon