Noticias del español

| Alberto Iglesias Fraga (TICbeat.com, España)

Tendremos un corpus textual de español para desarrollar la inteligencia artificial sobre el lenguaje

La Secretaría de Estado de Agenda Digital ha ampliado su colaboración con la RAE para crear un corpus de nuestro idioma que ayude a entrenar los sistemas inteligentes basados en el lenguaje en español.

Cuando uno aborda los desafíos de la inteligencia artificial, a menudo oímos alabanzas y ensoñaciones sobre algoritmos cada día más potentes y capaces de fraguar milagros a la hora de analizar datos y reconocer fuentes de lo más originales en tiempo real. Sin embargo, puede que nos olvidemos de algo igualmente relevante: la innovación en IA y aprendizaje profundo necesitan de información para entrenarse. Mucha información.

Si eso lo trasladamos al ámbito de las tecnologías del lenguaje… ¿qué repositorio de datos sobre nuestro idioma que la Real Academia Española? Algo así ha debido de pensar la Secretaría de Estado de Agenda Digital, órgano que ha firmado una adenda al convenio con la máxima institución del castellano para crear un corpus textual de español que servirá de base y referencia para esta clase de proyectos de nuevo cuño.

Leer más en www.ticbeat.com.

¡Hola!

¿Has buscado tu duda en nuestra web?

Si no la encuentras, rellena este formulario:

Los campos con * son obligatorios