Ese Real Academia Española (RAE) Y Servicios web de Amazon (AWS) han presentado como parte del proyecto Lengua Española e Inteligencia Artificial (LEIA)una nueva herramienta de inteligencia artificial que permitirá analizar el español en Internet.

Con la tecnología de la nube de AWS y el asesoramiento de la RAE, permitirá analizar la claridad del lenguaje administrativo, comparar la calidad del español por época o detectar errores comunes en los asistentes de voz y otros dispositivos de inteligencia artificial.

Pero de momento cuenta con 8.745.563 documentos de España y todos los países de habla hispana de América en su versión beta. Las fuentes: el español digital espontáneo actual, especialmente textos informales de redes sociales, foros o plataformas de venta online, así como textos periodísticos de comparación de tipos lingüísticos.

Funciona en tres fases: en la primera, los documentos se indexan mediante AWS Lambda; en el segundo se obtienen métricas -frecuencia, riqueza, variabilidad- que caracterizan los textos gracias a la inteligencia artificial y el aprendizaje automático, y finalmente se indexan los resultados del análisis para su visualización, con los filtros adecuados para verlos en tiempo real.

“Hay que convencer a las máquinas”

Santiago Muñoz Machado, Director de la RAE, explicó en la presentación de la herramienta RAE AWS que la Academia, junto con las academias de idiomas donde se habla nuestro idioma, siempre ha trabajado para monitorear cómo funciona el español a través de la lectura, revisando la forma de pronunciación de las expresiones, lo ha hecho por los sonidos.

Lo hace “despacio y con un bolígrafo en la mano”, aseguró. La creación de ficheros y la puesta en marcha de este seguimiento sirven para conformar los estándares que desarrolla la RAE y que dirige a los hispanohablantes. “Y tenemos suerte de que nos presten atención. Los que ignoren lo que se dice y el programa serán excluidos del mundo de la beca”, afirmó.

En su opinión, esto era conocido por todas las personas. Hasta ahora. “Las máquinas que han comenzado a hablar y usar el idioma son un peligro porque no nos comunicamos bien con ellas y estamos de acuerdo con las empresas tecnológicas para que nos ayuden a convencer a las máquinas que fabrican de que, siendo así, es necesario seguir las instrucciones de la Academia. reglas al producir asistentes de idiomas o traductores. Así que tenemos que modernizarnos”, explicó.

Trabajan para esto en un doble sentido. Primero, convenciendo a estas empresas para que utilicen bien el lenguaje, y luego armándose con las herramientas que ofrece la tecnología para mejorar su servicio.

Lo que has mostrado pertenece al segundo grupo. “Es una tecnología con la que podemos trabajar mejor. Queremos saber cómo varía el idioma o qué dificultades hay en las redes y en Internet. Y lo monitoreamos manualmente. La herramienta nos permitirá hacer esto automáticamente”.

“Modernidad e innovación, tradición e historia”

“Lo que ha logrado Amazon Web Services es increíble”, dijo Muñoz. La herramienta se carga con cualquier tipo de documento que se pueda analizar: periódicos, administración. “Y subimos nuestros estándares para saber si la calidad del idioma es suficiente, variada, si hay faltas de ortografía, si es correcta desde todo punto de vista”.

Miguel Álava, CEO de AWS en España y Portugal, Asimismo, en la presentación añadió que este proyecto es “ruptor” en muchos sentidos y que podría dar lugar a nuevos desarrollos en otras áreas. “Nuestro deseo es crear, aprender y compartir. Así comenzaron nuestras conversaciones con la RAE”.

“Estamos seguros de que todas las empresas que trabajan con nosotros se beneficiarán como portadoras del idioma español, no solo aquí sino en todo el mundo. El proyecto combina muchos componentes importantes para el momento en que vivimos. Modernidad e innovación, tradición e historia. Pero es importante recalcar que acaba de nacer, que es el primer paso. Esperamos que sean muchos más”, explicó Álava.

Dejar respuesta

Please enter your comment!
Please enter your name here