Sociedad y Justicia
Ver día anteriorLunes 5 de enero de 2015Ver día siguienteEdiciones anteriores
Servicio Sindicado RSS
Dixio

Miguel Ángel Sánchez Pérez diseñó software para textos

Alumno del IPN gana en Inglaterra concurso de detección de piratería
 
Periódico La Jornada
Lunes 5 de enero de 2015, p. 34

Miguel Ángel Sánchez Pérez, alumno del Instituto Politécnico Nacional (IPN), obtuvo el primer lugar en la categoría de alineación de textos en el undécimo concurso del Laboratorio de Evaluación en Detección de Plagio, Identificación de Autoría y Mal Uso de Software Social, en la Universidad de Sheffield, Inglaterra, al crear un modelo de detección de plagio que permite identificar textos producidos por la piratería.

El estudiante mexicano ganó junto con los investigadores Alexander Gelbukh y Grigori Sidorov, del Centro de Investigación en Computación de la casa de estudios británica, quienes lo asesoraron.

Sánchez Pérez explicó que la localización de fragmentos de texto semejantes entre dos documentos se denomina alineación de textos.

Por ejemplo, cuando el primer párrafo del texto corresponde al tercero de otro escrito, y ese es el objetivo del modelo, apuntó.

El prototipo desarrollado por Sánchez Pérez para obtener el grado de maestro en ciencias de la computación, superó en el certamen a trabajos de Chile, Estados Unidos, España, Alemania, China y Reino Unido. Asimismo, por esta aportación tecnológica recientemente obtuvo el segundo lugar nacional en el concurso de mejor tesis de la Sociedad Mexicana de Inteligencia Artificial.

Sánchez Pérez señaló que descubrir un plagio implica la búsqueda y conocimiento de una amplia cantidad de textos en fuentes originales; por ello, dijo, científicos de todo el mundo centran sus investigaciones en la generación de trabajos para la detección automática de plagio.

Para competir, dijo, el modelo debe llevarse a un sistema o software con alto grado de eficiencia, porque se evalúan miles de documentos y se hace un gran número de comparaciones entre textos en busca de fragmentos plagiados.

“En el certamen se proporciona a los equipos competidores un corpus (base de datos) aproximado de 5 mil pares de documentos a comparar, los cuales pueden o no contener plagio”, señaló. Agregó que en el proceso del concurso se deben encontrar los fragmentos similares entre un par de documentos que les proporcionan.

Para evaluar qué tan bien encontramos un par de fragmentos similares, las medidas usadas son: precisión y exhaustividad. Precisión se refiere a cuántos caracteres del fragmento que detecté realmente fueron plagiados, mientras exhaustividad se refiere a cuántos, de la cantidad de caracteres que fueron plagiados, detecté. La combinación de esos dos parámetros nos permitió ganar el concurso, expresó.