Borrar
El equipo de la Universidad de Salamanca liderado por Julio Borrego, a la izquierda, y José Antonio Bartol.
El Corpus del Español, mucho más que palabras

El Corpus del Español, mucho más que palabras

Equipos de lingüistas de las universidades de Salamanca y León trabajan en la recopilación de millones de palabras para su estudio en el futuro

redacción / word

Domingo, 15 de marzo 2015, 11:54

Necesitas ser suscriptor para acceder a esta funcionalidad.

Compartir

Las palabras expresan emociones, sentimientos, órdenes, pero también inquietan, movilizan, hacen sentir amor y odio, en definitiva son poderosas, de ahí la importancia de estudiarlas, investigarlas como si de una «fotografía fija» se tratara, para a partir de ellas, conocer cómo era la lengua en una época determinada. Esa es la labor que llevan a cabo los profesionales que trabajan en el desarrollo del Corpus del Español del siglo XXI, también denominado Corpes XXI, una investigación sobre el léxico y la gramática del idioma, que permite saber qué palabras se usan más frecuentemente en un determinado país, cuando se introdujeron y si después fueron olvidadas.

Por ejemplo, si hay una palabra que está «de moda» hoy en día en España, esa es la de «populismo» y el Corpus del Español da la posibilidad a quien quiera satisfacer su curiosidad, de saber dónde se utiliza con más asiduidad, que en este caso es en países latinoamericanos como Bolivia y Venezuela, y si es realmente novedosa en España. En el futuro, su uso en los medios de comunicación, publicaciones y programas de televisión, podrá ser analizado y algún investigador del mañana podrá comprobar como en la época del 2015, en España comenzó a usarse de forma más frecuente.

Salamanca y León

En esta labor de recopilación, impulsada por la Real Academia de España, colabora un equipo de filólogos liderado por los profesores Julio Borrego y José Antonio Bartol, así como también participan expertos de la Universidad de León, que son las únicas de Castilla y León que se han sumado a esta iniciativa, junto con otras cuatro instituciones académicas españolas.

Borrego detalla que el objetivo es reunir en 2018, un conjunto textual formado por 400 millones de vocablos y formas de la lengua de 500 millones de hispanohablantes. Aunque será una herramienta indispensable para los investigadores, afirma que es de acceso abierto y gratuito para toda la sociedad y una vez que se conozcan sus posibilidades, cualquier ciudadano puede resolver sus dudas o curiosidad acerca de las palabras que desee. ¿Qué usted quiere saber que se usa más, si pseudo o seudo?, pues al Corpes, o ¿cuándo comenzó a usarse el término teléfono móvil?, continúa, tendrá que mirar este programa, porque no se podrá estudiar la lengua ni la gramática sin él, es «imprescindible».

Igual opina Bartol, quien además asegura que es el proyecto de la RAE «más importante» de cara al futuro y es una herramienta «potentísima e imprescindible». De hecho, explica que es el «más potente» que existe hoy en día de todos los que hay, como el modelo anglosajón, o el dedicado al francés, por el número de entradas que recoge. Sin embargo, se trata de «un trabajo sin fin», porque el idioma está en continua evolución.

Cada grupo tiene adjudicado un apartado muy concreto sobre un tema, por ejemplo «periódicos de Cuba sobre salud» y a partir de ahí se pone a trabajar para incluir todas las palabras. Se calcula que se introducen unos 25 millones de términos por año y cada equipo se compromete a un millón al año, aunque por ejemplo hay quienes tienen mayores posibilidades, como la Universidad de Barcelona y puede llegar a cinco millones de palabras. Por tanto, detallan que este corpus se elabora a partir de textos orales y escritos, por lo que también tienen que trabajar en formatos como programas de televisión u obras de teatro.

El Corpes XXI, que supone la continuación del trabajo realizado con los corpus CREA y CORDE, es una iniciativa de la RAE y de la Asociación de Academias de la Lengua Española (Asale) en la que trabajan, además del equipo central, ocho equipos externos a las Academias: seis de universidades españolas (Alcalá de Henares, Autónoma de Barcelona, León, Salamanca, Santiago de Compostela y Valencia), la Academia Argentina de Letras y la Fundación Comillas.

Además de los profesores Julio Borrego Nieto y José Antonio Bartol Hernández, encargados de dirigir al equipo de Salamanca, el resto de miembros que lo forman son Sheila Lucas Lastra, Olga Ivanova, María Herreros Marcilla, Seila Pastor Martín, Rosa Piñuel Vega y Dana Scarinci Zabaleta.

Publicidad

Reporta un error en esta noticia

* Campos obligatorios