 |
Fundamentos
3-Input: Ingreso de Multimedios
|
 |
Ingreso de Multimedios
(Multimedia)
es una combinación de sonido e imágenes con texto y gráficos. Esto incluye cine, animaciones, música, gente conversando, efectos sonoros como el rugido de una multitud o el de vidrios que se rompen.
Input Vocal |
|
Los sistemas de entrada o input de voz ya se encuentran disponibles a nivel de minoristas. Debe tenerse cuidado de obtener el sistema correcto o sufrirá una desilusión.
Decida primero que es lo que usted quiere hacer, ya que algún programa para ingreso de la voz, puede ser que no haga todo lo que usted desea :
|
Ingreso de Datos - |
Hablarle a la computadora, cuando tiene sus ojos y manos ocupadas, resultaría ciertamente muy
eficiente. Pero usted tendrá que cuidar mucho cómo
pronuncia.
|
Comando y Control -
|
Podrá ordenar a la computadora qué es lo que tiene que hacer, en lugar de tipear un comando que diga “Guarde el archivo”. Cuidado también aquí.
El diccionario de las palabras que pueda entender, no incluye algunas de las que resultan "de uso corriente" y que por lo tanto deberían ser obligatorias.
|
Reconocimiento de la persona que habla - |
Medidas de seguridad , pueden requerir que usted pro- nuncie una frase determinada y la computadora deberá reconocer su voz para dejarlo pasar.
|
De voz a texto - |
La traducción directa de palabras habladas convertidas al equivalente de haberlas tipeado, le vendría bien a muchos autores. Usted tendrá que cuidarse mucho de pronunciar esas frases dificiles de ser traducidas como: "hmmmm" y "ah", "bien", "ummm" |
(Nov. 2000) - El reconocimiento de la voz y el software de discurso-a-texto está mejorando rápidamente. ¡Por lo menos una versión en venta tiene un periodo de entrenamiento por debajo de los 5 minutos e ignora los sonidos de relleno como "hummm". Esto está volviéndose excitante y realmente útil!
Varias empresas ya están usando el reconocimiento de la voz en sus sistemas telefónicos. Por ejemplo, para averiguar cual es el saldo de su cuenta bancaria, en lugar de pulsar su número de cuenta en el teclado del teléfono escogiendo la opción 3 para obtener el Saldo, usted podría decir en voz alta su número de cuenta y a continuación "Saldo Actual". La computadora incluso le contestará y le repetirá lo que usted dijo, para que si fuera necesario pueda hacerle correcciones. ¡Guau!
|
|
 |
|
¿Cómo se transforma la voz en datos?? |
|
1. | Convierte las ondas de voz a su forma digital
(proceso de señal digital -DSP) |
2. | Compara la entrada digital de la voz con las plantillas guardadas |
3. | Verifica las reglas de gramática, para deducir las palabras correctas |
4. | Presenta las palabras no
reconocidas, para que el usuario las identifique |
|
|
Distintos Tipos de
Reconocimiento de la Voz
|
Sistema
Locutor Dependiente |
El software debe ser entrenado para que reconozca cada usuario individual. Insumirá muchas horas para volcar el diccionario en la computadora y ésto, siendo
optimistas.
|
Sistema Locutor Independiente |
El software reconoce palabras de la mayoría de los que hablen sin entrenamiento previo. Para eso usa modelos. Sin embargo, un acento fuerte podría derrotar al
sistema.
|
Reconocimiento del Habla,
Discreto |
El locutor deberá hacer pausas entre las palabras para que la computadora pueda reconocer dónde termina cada una de
ellas.
|
Reconocimiento
Continuo del Habla
|
El que habla puede usar un flujo de conversación normal. |
Lenguaje Natural |
El locutor puede llegar a decirle a su computadora algo así como. “Cuándo podríamos enviarle una docena del artículo 2000 en color azul a Olavarría” ¡Y obtener una respuesta!.
¡La ciencia ficción es una realidad!
|
|
|
Entrada (Input) de Video |
|

|
~~ 1 Cor. 10:31 ...hagan cualquier otra cosa, háganlo todo para la gloria de Dios. ~~
Actualizado por última vez el día:
14 Dec 2010 |