Cómo se trascriben los lenguajes naturales

El reconocimiento automático del habla (RAH) es una disciplina de la inteligencia artificial, como veíamos en un artículo anterior, que trata de comunicar lo que los humanos hablamos con los ordenadores. Los avances que en este campo se están desarrollando van en el sentido de mejorar el reconocimiento y procesamiento de lenguajes naturales (PLN). Que un programa sea capaz de reconocer simples comandos de voz, o frases cortas tipo robot, no hace que sea un avance para el trabajo del día a día de los profesionales. Pero sí supone facilitar el trabajo y ahorrar tiempo que sean capaces de procesar el lenguaje natural, o sea la forma que tenemos los hablantes de expresarnos. El sistema de reconocimiento de voz de Invox Medical utiliza esta tecnología, que busca el reconocimiento natural del habla de nuestros profesionales de la medicina, de esta manera pueden dictar sus informes de la forma que hablan naturalmente y el software es capaz de transcribirlo.

 

El PLN es una parte de varias disciplinas: ciencias de la computación, inteligencia artificial y la lingüística. Se encarga de investigar y crear mecanismos eficaces que permitan la comunicación entre personas y máquinas mediante lenguajes naturales. Crea programas que simulan la comunicación humana. El procesamiento de lenguajes naturales no es un proceso sencillo, de hecho lleva décadas en continuo avance.

 

Algunas de las dificultades en el procesamiento de lenguajes naturales son las siguientes: -Ambigüedad. El lenguaje natural es ambiguo en varios aspectos: lexicalmente una palabra puede tener varios significados, y dependiendo del contexto significar una u otra cosa; es ambigua a nivel referencial, debe ser capaz de resolver los elementos gramaticales deícticos que señalan algo del contexto; también es ambiguo a nivel pragmático, una frase no siempre significa lo que dice, podemos estar hablando irónicamente, y es un reto para el PLN.

 

-Separación entre las palabras. Cuando se habla no se hacen pausas entre palabras, por lo que las palabras deben separarse según el sentido lógico que tengan en el conjunto.

 

-Variaciones en el habla. Los habitantes de un mismo país no hablamos el mismo lenguaje exactamente, por lo que el programa deberá distinguir los distintos acentos, así como extranjerismos o regionalismos.

 

Algunas de las disciplinas que utilizan el PLN son el análisis del lenguaje, la traducción automática, la generación de lenguajes naturales, o, como en nuestro caso, el reconocimiento del habla.

 

Compartir

Deja un comentario

Tu dirección de correo electrónico no será publicada.

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.

Otros posts que pueden ser de su interés