Rodrigo Agerri, quien actualmente trabaja en el Centro para el Lenguaje Tecnológico de la Universidad del País Vasco, ha sido este viernes el introductor de la mesa redonda «El español y las máquinas», que se ha desarrollado en el Centro Internacional de Investigación de la Lengua Española (Cilengua) de San Millán de la Cogolla.
Esta mesa redonda ha cerrado el XIV Seminario Internacional de Lengua y Periodismo: «El español y las máquinas: lenguaje, ética y periodismo», organizado por la Fundación San Millán y la Fundéu BBVA —patrocinada por la Agencia EFE y el BBVA—
Ha incidido en que el trabajo en procesamiento de lenguaje no va a parar de crecer a través de tecnologías básicas que ahora son necesarias para un idioma.
Así, ha relatado cómo se trabaja para crear corpus del idioma, a través del etiquetado de palabras, que las clasifican como nombre, adjetivo o verbo, por su género u otras características; y, además, se incorporan parámetros para detectar ambigüedades, diferentes significados o usos. Esos corpus son la herramienta básica para entrenar a los sistemas de procesamiento de lenguaje natural con los que luego se construyen multitud de aplicaciones: correctores, traductores, creadores de contenido, sistema de voz…
Pero, a diferencia de lo que ocurre en lenguas como el inglés, en el español, «ni tenemos el corpus, ni los medios para crearlo”, ha lamentado.
«En el español existe un problema con lo que conocemos como datos etiquetados, en ese corpus, que no existe para la creación de la mayor parte de las aplicaciones y cuando está, no es de calidad», con lo que «las herramientas se acaban desarrollando en inglés», ha asegurado Aguerri, quien ha incidido en que «este proceso es muy costoso y en España no hay una iniciativa para desarrollarlo, como la hubo con el inglés».
Ha admitido que «se dio un primer paso» con el Plan de Impulso de las Tecnologías del Lenguaje, promovido por el Ministerio de Industria en 2015 y dotado con 90 millones de euros, de los que se han ejecutado desde entonces 15.
España, ha afirmado, «tiene capacidad intelectual para desarrollar su tecnología lingüística», pero «falta una estrategia a largo plazo» y «ser conscientes de que esto afecta a cuestiones del día a día, desde los correctores ortográficos a los robots que reconocen lo que se les dice o los motores de búsqueda en internet».
«Todas esas aplicaciones necesitan elementos básicos para su desarrollo y en eso no estamos avanzando en el español, aunque debería ser una cuestión estratégica que nos afecta a todos», ha señalado este investigador, para quien «si no lo hacemos nosotros, lo harán otros, en China o Estados Unidos, y seremos tecnológicamente dependientes».
La directora de Tecnología e Innovación de IBM España, Portugal, Grecia e Israel, Elisa Martín, ha asegurado que el mundo empresarial hispanohablante «necesita ese corpus» de palabras para crear aplicaciones, «pero queda mucho por hacer para que las industrias se suban a ese carro».
«El sector industrial —ha puntualizado— está analizando ahora mismo cómo aunar el conocimiento escrito que existe en diferentes campos, el conocimiento que tienen sus empleados y cómo se puede transmitir todo eso a sus departamentos en busca de más efectividad en todos los puestos».
Pero en ese proceso «tenemos una gran dificultad porque si no podemos entrenar a las máquinas que hacen ese proceso en español, son más eficaces en inglés» y «así aumenta el riesgo de que dominen otras lenguas».
Además, ha explicado, en las áreas de toma de decisiones de grandes empresas españolas «se reciben datos y documentación que se han extraído por un sistema en inglés».
Ha concluido que el español, a nivel empresarial, se encuentra en una situación de «dominación por el inglés», debido «a la falta de batalla»
En esa misma línea, la lingüista Leticia Martín-Fuertes ha lamentado que «se hable mucho de los millones de personas que hablan español, pero la realidad es que el mundo anglosajón está más abierto al futuro». Por ello, «si en el español no nos adaptamos a la velocidad de investigación del inglés, aunque no vaya a desaparecer, sí hay motivos para preocuparse por su futuro», ha finalizado.