investigadores de la Facultad de Ciencias Físicas y Matemáticas de la Universidad de Chile, quienes decidieron combatir el plagio académico. La idea se originó en el Departamento de Ingeniería Industrial (DII) hace dos años, cuando el Profesor Juan D. Velásquez, experto en minería de datos y en web intelligence, decidió embarcarse en el desafío de crear un sistema capaz de detectar automáticamente la originalidad de un trabajo o la copia del mismo. Velásquez reunió a un equipo interdisciplinario de ingenieros, sicólogos, sociólogos, lingüistas y a los académicos del DII, Sebastián Ríos P. y Gastón L’Hullier C., quienes gracias al financiamiento de un Fondo de Fomento Científico y Tecnológico 2010 (FONDEF), crearon Document Copy Detector (DOCODE). Este software detecta copias desde la web, parafraseos y relaciones semánticas. En otras palabras, puede identificar qué párrafos no fueron escritos por el mismo autor, luego buscar coincidencias con otros textos y finalmente mostrar la fuente original. Trabajo en equipo En DOCODE, herramienta con una alta componente científica, se conjugó el trabajo de tres áreas. Por una parte, un equipo de sociólogos y sicólogos midieron el impacto de la herramienta, principalmente, en colegios y universidades; lingüistas definieron las premisas básicas sobre qué es plagio y sus diferentes clases, además de proporcionar información clave para que el equipo de ingenieros desarrollara los algoritmos de búsqueda en textos, los mismos que realizan el trabajo computacional como recuperación de información y minería de datos. Este proceso resultó bastante complejo, tal como lo explica Gabriel Oberreuter creador de los algoritmos del DOCODE: “Lo que hace el programa es tomar los recursos de la lingüística propiamente tal y los adapta a la computación”. Según el ingeniero industrial, el software compara los textos a un nivel de palabras, integrando estadísticas. “Por ejemplo, quienes acostumbran a copiar, de un párrafo de 30 palabras, estadísticamente lo más probable es que cambien cinco vocablos. Desde esa base se desarrolla el algoritmo”, agrega. Desde el 2009, el sistema creado en la FCFM ha ido adquiriendo cada vez mayor precisión. “En un comienzo postulamos un algoritmo que comparaba un texto con distintos documentos”, indica Oberreuter. Esta labor es la que se denomina plagio externo, es decir, comparar un texto con otros que se encuentran en una base de datos, que pueden ser los textos que alberga Internet o los incorporados por quien ocupa la herramienta. “En conclusión permite detectar si un párrafo proviene de otro párrafo y te alerta”, añade. Además, si un profesor, por ejemplo, quiere asegurarse de que los alumnos de un mismo curso no se han copiado puede ingresar todos los trabajos a la base de datos con la que compara el DOCODE. No contentos con la primera versión del software, el equipo del DII decidió ir más allá y avanzar en un ámbito en el que po- Investigadores Patricio Moya, Juan Velásquez y Gabriel Oberreuter. 29