Noticias del español

| Agencia Efe

Crean nuevos sistemas para detectar palabras clave en lingüística computacional

La doctora de la Universidad de Huelva Noa Cruz, del Departamento de Tecnologías de la Información, ha desarrollado nuevos sistemas de aprendizaje automático que permiten la detección de palabras claves en lingüística computacional.

El trabajo se enmarca en la investigación «Detección de la negación y la especulación en textos médicos y de opinión», que se centra en los dos dominios en los que la negación y la especulación como información lingüística han recibido más atención: el biomédico y el de los artículos de opinión, ha informado la UHU en una nota.

El trabajo ha obtenido el primer premio en la XIII Edición de los Premios SEPLN (Sociedad Española para el Procesamiento del Lenguaje Natural) a la Investigación en Procesamiento del Lenguaje Natural, cuyo objetivo es la promoción y divulgación de la investigación en este campo.

En el campo biomédico, el método propuesto mejora los resultados obtenidos hasta la fecha para la subcolección de documentos clínicos del llamado corpus Bioscope, que integra todo el conocimiento exacto dentro del ámbito de la investigación biomédica.

En el segundo, la novedad de la investigación radica en que aporta el primer sistema entrenado y evaluado en la colección de artículos de opinión Simon Fraser University anotado con información negativa y especulativa, al tiempo que supone el primer intento para detectar la especulación en este dominio.

Según la investigadora onubense, ingeniera informática, «se trata de identificar a nivel de la frase los tokens o unidades básicas del lenguaje (números, signos de puntuación, palabras, etc.) que se ven afectados por las palabras claves de negación y especulación».

En cuanto al ámbito biomédico, el trabajo de Cruz supone el primer estudio de evaluación comparativo de tokenizadores, por lo que aporta una información de enorme utilidad para desarrolladores de PLN a la hora de elegir las herramientas de tokenización más apropiadas como primera fase de cualquier tarea de lo que en lingüística computacional se denomina «minería de texto».

Con respecto al dominio de los textos de opinión, hay sólo unos pocos trabajos sobre la detección de la información lingüística negativa y no hay ningún trabajo en la identificación de la especulación.

El trabajo de Noa Cruz pretende corregir esta deficiencia con el desarrollo de un sistema que reconoce automáticamente tanto las palabras clave de negación y especulación como su alcance.

El desarrollo de nuevos sistemas de aprendizaje automático que propone este trabajo podría beneficiar a muchas de las aplicaciones que el campo de la lingüística computacional pone al servicio de los estudios científicos.

¡Hola!

¿Has buscado tu consulta?

Si no la encuentras, rellena nuestro formulario: