Intel·ligència Artificial en el reconeixement de veu

El reconeixement de veu és un tipus de intel·ligència artificial, molt estesa en l'atenció sanitària, en camps com la radiologia, que busca establir comunicació entre l'home i els ordinadors o dispositius intel·ligents, a través del llenguatge humà. La tecnologia de reconeixement de veu fa que el processador sigui capaç de desxifrar la informació continguda en la veu humana i fins i tot de predir el que l'humà vol dir per reduir la taxa d'error en la transcripció. Els primers passos en aquest sentit van començar als anys cinquanta, però ha estat en l'última dècada quan s'ha avançat gegantí en el reconeixement del llenguatge natural.

El reconeixement automàtic de la parla consisteix en dos processos d'aprenentatge diferenciats:

  • D'una banda un aprenentatge deductiu que consisteix en la transferència del coneixement humà a un sistema informàtic;
  • I d'altra banda un aprenentatge inductiu, aquí es tracta de que el sistema pugui obtenir aquell coneixement a través d'exemples. L'evolució dels sistemes de reconeixement de veu fa que la màquina pugui interpretar com un “sí” no només si escolta aquesta paraula, sinó també si escolta expressions equivalents. Això facilita el reconeixement del llenguatge natural tal com ho faria un ésser humà, amb una precisió superior al 90%

Els programes o sistemes de reconeixement automàtic de veu també es classifiquen segons els paràmetres següents:

  • Segons el seu Entrenabilitat, aquí entraria en joc si un sistema es pot utilitzar directament o requereix una formació prèvia dels usuaris abans de ser utilitzat.
  • Segons el Dependència de l'orador, seria si el sistema hauria d'estar o no entrenat per a cada usuari diferent.
  • Segons el continuïtat, si el sistema reconeix la parla natural o requereix pauses entre paraules.
  • Segons el robustesa, si funciona correctament en ambients sorollosos o amb altres veus de fons o no.
  • I d'acord amb el mida del domini, si el sistema pot reconèixer o no la llengua d'un domini petit o extens, per exemple si està dissenyat per a una companyia telefònica i està adaptat a un nombre determinat de paraules relacionades.

Aquests avenços s'han vist reflectits en la millora de les diverses tecnologies relacionades amb els programes de reconeixement de veu, com les utilitzades en l'àmbit mèdic per a la prescripció de receptes o informes mèdics. La tecnologia de reconeixement automàtic de veu, aplicada a camps com la radiologia o l'anatomia patològica, augmenta considerablement l'eficiència del treball, estalviant quantitats considerables de temps.

Finalment, la qualitat del micròfon utilitzat per interactuar amb la màquina serà determinant en el resultat final, per la qual cosa cal conèixer Quines són les característiques d'un bon micròfon.

A INVOX Medical som especialistes en reconeixement de veu per a l'assistència sanitària. La nostra intel·ligència artificial per dictar informes mèdics ja s'utilitza en més de 550 hospitals de 20 països. Vols saber-ne més?

Comparte este post