martes, 26 de junio de 2012

Un ‘detective web’ recupera el 81% de los enlaces rotos

Investigadores de la UNED desarrollan un sistema que permite acceder a links erróneos
“La página que busca ya no existe”. Pocas cosas más frustrantes que intentar buscar información en la Red y que aparezca un mensaje como este. Y sin embargo, a todos los internautas les sucede con gran frecuencia. El 67% de las direcciones de Internet se convierten en erróneas tras cuatro años de vida. A veces, esto sucede porque la página ha desaparecido; en otras ocasiones, la información ha sido movida de sitio.

Para acabar con el molesto problema de los links erróneos, investigadores de la UNED han desarrollado un sistema que hace la función de un ‘detective privado’ para encontrar las pistas de ese contenido y seguir así su rastro. La nueva herramienta permite recuperar hasta el 81% de los enlaces obsoletos.

“Estas pistas consisten en referencias y enlaces obsoletos en motores de búsqueda, librerías digitales, servicios web y redes sociales”, explica Juan Martínez-Romo, investigador del grupo de Procesamiento de Lenguaje Natural y Recuperación de Información de la UNED y autor principal del proyecto.

Recabadas las pistas, el sistema Detective Brooklynk elabora dinámicamente una estrategia para encontrar la página desaparecida o una equivalente de la forma más eficiente, es decir, consumiendo los mínimos recursos y el menor tiempo. De este modo, insertando el link erróneo, el programa devuelve al usuario una lista de enlaces en los que puede estar la información que busca, ya sea de la misma página o bien de otras que lo hayan recogido.

Para comprobar la efectividad de la herramienta, cuyo desarrollo se ha publicado en la revista Information Processing and Management, los investigadores seleccionaron aleatoriamente un conjunto de páginas con enlaces rotos e intentaron recuperar su contenido. “Con el sistema que hemos desarrollado, conseguimos recuperar el 81% de los links erróneos”, asegura Martínez-Romo.
Los motores de búsqueda penalizan
El problema de los enlaces obsoletos es una de las asignaturas pendientes de Internet, y perjudica tanto a usuarios como a creadores. “Es evidente que, de cara a un internauta, encontrar este tipo de problemas dificulta y entorpece sus búsquedas, pero, además, esto repercute en una pérdida de fiabilidad y prestigio para el dueño de la página”, comenta el investigador.

A estas molestias se suma el hecho de que los motores de búsqueda penalizan a las páginas a la hora de mostrarlas en la lista de resultados. En los últimos años, han aparecido algoritmos que proponen la modificación del PageRank (algoritmo de ranking utilizado por los motores de búsqueda) para que tenga en cuenta esa clase de errores. El sistema desarrollado por la UNED evitaría esta penalización.

Fuente: http://www.abcdesevilla.es/20120620/tecnologia/rc-detective-recupera-enlaces-rotos-201206201337.html

No hay comentarios:

Publicar un comentario

Nota: solo los miembros de este blog pueden publicar comentarios.