La Inteligencia Artificial en el reconocimiento de voz

El reconocimiento de voz es un tipo de inteligencia artificial, muy extendida en sanidad, en ámbitos como la radiología, que trata de establecer una comunicación entre el hombre y los ordenadores o dispositivos inteligentes, a través del lenguaje humano. La tecnología de reconocimiento de voz hace que el procesador sea capaz de descifrar la información que contiene la voz humana e incluso de predecir lo que el humano quiere decir para reducir la tasa de error en la transcripción. Los primeros pasos en este aspecto comenzaron en los años 50, pero ha sido en la última década cuando se ha hecho un avance gigantesco en el reconocimiento del lenguaje natural.

El reconocimiento automático del habla consta de dos procesos de aprendizaje diferenciados:

  • Por un lado un aprendizaje deductivo que consiste en la transferencia de conocimientos del hombre a un sistema informático;
  • Y por otro lado un aprendizaje inductivo, aquí se trata de que el sistema sea capaz de obtener esos conocimientos a través de ejemplos. La evolución de los sistemas de reconocimiento de voz hacen que la máquina pueda interpretar como un “sí” no solo si oye esa palabra, sino también si escucha expresiones equivalentes. Lo que facilita el reconocimiento del lenguaje natural tal y como lo haría un ser humano, con una exactitud por encima del 90%

Los programas o sistemas de reconocimiento automático de voz también se clasifican según los siguientes parámetros:

  • Según su entrenabilidad, aquí entraría en juego si un sistema puede usarse directamente o requiere un entrenamiento previo del usuario antes de usarse.
  • Según la dependencia del hablante, sería si el sistema debe entrenarse o no para cada usuario diferente.
  • Según la continuidad, si el sistema reconoce el habla natural o requiere de pausas entre palabras.
  • Según la robustez, si funciona correctamente en ambientes ruidosos o con otras voces de fondo o no.
  • Y según el tamaño del dominio, si el sistema puede o no reconocer el lenguaje de un dominio reducido o extenso, por ejemplo si está diseñado para una compañía de telefonía y está adaptado a determinado número de palabras relacionadas.

Estos avances se han plasmado en la mejora de las diversas tecnologías relacionadas con los programas de reconocimiento de voz, como pueden ser los que se usan en el ámbito médico para el dictado de recetas o informes médicos. La tecnología del reconocimiento automático de voz, aplicado a ámbitos como la radiología o la anatomía patológica, aumenta considerablemente la eficiencia del trabajo ahorrando considerables cantidades de tiempo.

Por último, la calidad del micrófono que se utilice para interactuar con la maquina va a ser determinante en el resultado final, por lo que es necesario conocer cuáles son las características de buen micrófono.

Compartir

1 comentario en “La Inteligencia Artificial en el reconocimiento de voz”

  1. Pingback: ¿Cómo debe evolucionar la radiología del Siglo XXI? - INVOX Medical

Deja un comentario

Tu dirección de correo electrónico no será publicada.

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.

Otros posts que pueden ser de su interés