Noticias del español

| | |

|

Agencia Efe

Jueves, 8 de marzo del 2012

El Corpus del Español del Siglo XXI tendrá 300 millones de formas en el 2014


La Real Academia Española (RAE) y el Banco de Santander han renovado el convenio de colaboración que mantienen desde el 2007 y que permitirá la culminación del Corpus del Español del Siglo XXI y el proceso de digitalización y actualización tecnológica del archivo académico.


Según el acuerdo suscrito hoy por José Manuel Blecua, director de la RAE, y Emilio Botín, presidente de Banco Santander, y que se mantendrá hasta el 2014, esta entidad bancaria aportará 700 000 euros para proyectos de la RAE, especialmente el CORPES XXI, cuyo objetivo final es reunir, en el 2014, un total de 300 millones de formas y palabras de la lengua común de 450 millones de hispanohablantes.

 

Este corpus, que actualmente cuenta con cerca de 100 millones de formas, se elabora a partir de textos orales y escritos. El material proviene tanto de medios impresos —libros y prensa— como de contenidos publicados en Internet o emitidos en canales de información audiovisual, informa la RAE en una nota.

 

Los textos que sirven de base al CORPES XXI reflejan adecuadamente el español de todo el mundo: el 30 % de las formas proceden de España y el 70 % restante de América.

 

El resultado de esta «ambiciosa recopilación será la creación de una gran base de datos que, unida a un potente programa de recuperación, permitirá consultar los ejemplos por países, fechas o temas», se añade en la nota.

 

Coordinado por el académico español Guillermno Rojo, el CORPES XXI es una iniciativa de la RAE y de la Asociación de Academias de la Lengua Española (ASALE), en la que trabajan, además del equipo central, ocho equipos externos a las Academias.

 

Seis de esos equipos son de diferentes universidades españolas —Alcalá de Henares, Autónoma de Barcelona, León, Salamanca, Santiago de Compostela y Valencia—, la Academia Argentina de Letras y la Fundación Comillas.

 

El CORPES XXI supone la continuación del trabajo realizado con los corpus CREA (Corpus de Referencia del Español Actual) y CORDE (Corpus Diacrónico del Español. Este último cuenta con cerca de 300 millones de formas desde los orígenes del idioma hasta 1974, y el CREA, con 155 millones de formas desde 1975 hasta 2004.

 

El convenio suscrito entre la RAE y el Banco Santander incluye también el apoyo económico para dotar al Archivo de la Real Academia Española de los medios tecnológicos necesarios para realizar sus funciones de difusión y conservación.

 

El proyecto contempla dos fases: la informatización de las fichas descriptivas y la digitalización de las series documentales de mayor valor testimonial e histórico.

 

Inicialmente, con motivo de la conmemoración de su tercer centenario, la Academia abordará el tratamiento de la documentación correspondiente al siglo XVIII, a la par que la descripción, indización y digitalización de los 62 libros manuscritos de actas de sesiones plenarias, en los que, desde su fundación en 1713, los distintos secretarios de la Corporación han ido registrando escrupulosamente el acontecer académico. 

¡Hola!

¿Has buscado tu consulta?

Si no la encuentras, rellena nuestro formulario: