Cuando uno aborda los desafíos de la inteligencia artificial, a menudo oímos alabanzas y ensoñaciones sobre algoritmos cada día más potentes y capaces de fraguar milagros a la hora de analizar datos y reconocer fuentes de lo más originales en tiempo real. Sin embargo, puede que nos olvidemos de algo igualmente relevante: la innovación en IA y aprendizaje profundo necesitan de información para entrenarse. Mucha información.
Si eso lo trasladamos al ámbito de las tecnologías del lenguaje… ¿qué repositorio de datos sobre nuestro idioma que la Real Academia Española? Algo así ha debido de pensar la Secretaría de Estado de Agenda Digital, órgano que ha firmado una adenda al convenio con la máxima institución del castellano para crear un corpus textual de español que servirá de base y referencia para esta clase de proyectos de nuevo cuño.
Leer más en www.ticbeat.com.