Un joven informático de la UNLP desarrolló un sistema que permite resumir textos en forma automática

Con un revolucionario desarrollo informático para obtener resúmenes de texto en forma automática, el licenciado en Sistemas de la UNLP, Augusto Villa Monte, logró obtener en forma simultánea y con la máxima calificación el título de Doctor en Ciencias Informáticas de la Universidad Nacional de La Plata y el título de Doctor en Tecnologías Informáticas Avanzadas de la Universidad de Castilla La-Mancha, España. Su tesis doctoral titulada “Generación automática inteligente de resúmenes de textos con técnicas de Soft Computing”, obtuvo una calificación de diez puntos en ambas instituciones y, además, la mención Cum Laude de la casa de estudios española en reconocimiento a su rendimiento académico destacado.

Dado el crecimiento exponencial del volumen de información textual disponible en formato digital, se hace imprescindible disponer de herramientas automáticas que, a partir de un gran cúmulo de información, diferencien lo esencial de lo que no lo es. Es que, como se sabe, no toda la información presente en un texto tiene el mismo nivel de relevancia; no sólo en cuanto a contenido, sino también al interés.

Para resolver esta problemática el investigador del III LIDI, Laboratorio de Investigación en Informática de la Facultad de Informática de la UNLP desarrolló una solución para obtener resúmenes de texto automáticamente, especialmente en aquellas áreas de la ciencia, como la medicina, en las que la investigación y la difusión de la información son fundamentales para su desarrollo.

Villa Monte explicó que “la tesis que realicé desarrolla dos estrategias diferentes para construir resúmenes automáticos de textos utilizando técnicas de Soft Computing que se emplean para solucionar problemas que manejan información incompleta, con incertidumbre y/o inexacta”.

Y agregó: “la primera de estas estrategias utiliza una técnica de optimización mediante cúmulo de partículas que, a partir de la representación vectorial de los textos, construye un resumen extractivo combinando adecuadamente varias métricas de puntuación”.

“Mientras que la segunda metodología está relacionada con el estudio de la causalidad inspirado en el manejo de la incertidumbre por parte de la lógica borrosa o difusa. Aquí, el análisis de los textos se realiza a través de la construcción de un grafo mediante el cual se obtienen las relaciones causales más importantes y las restricciones temporales que afectan a su interpretación”.

“Ambas estrategias implican fundamentalmente la clasificación de la información y reducen el volumen del texto considerando al receptor del resumen construido en cada caso. Por un lado, se identifican los criterios que utiliza el usuario para seleccionar las partes relevantes de un documento. Por el otro, se construye un grafo a partir de patrones textuales útiles para la toma de decisiones”, concluyó el investigador.

Villa Monte logró el doble doctorado ya que su tesis fue cotutelada por ambas universidades. Una cotutela es una manera especial de realizar una tesis doctoral bajo la supervisión de directores de dos universidades diferentes. Si bien la tesis es una sola, da lugar a la obtención del título de doctor por ambas universidades e implica que se firme un convenio específico aceptando su realización, que incluye la defensa de la tesis ante un jurado propuesto por ambas instituciones.