sábado, 26 de abril de 2014

Recupera paginas web en el tiempo


Muchas veces hemos hablado de lo "rencoroso" que es Internet y que no se olvida de nada, pues hoy vamos a hablar de hasta que limites podemos buscar esas paginas en Cache desde hace años.

La herramienta que usaremos sera wayback machine, una herramienta online que nos permitirá ver snapshot de paginas web en días concretos. Esto puede ayudarnos a saber como estaba la web en ese momento y recuperar imágenes, texto o simplemente ver su evolución en el tiempo.

web de coca-cola 2004
Pagina web de Coca-Cola el 17 de Octubre de 2004


Y si queremos un articulo en concreto borrado de una pagina, ¿Puedo recuperarlo?, pues esto dependerá si fue cacheado por los buscadores y de la habilidad que tengamos para buscarlo.

Aquí usaremos nuestros trucos que explicamos en Hacking con buscadores, no hay un buscador infalible y deberemos jugar tanto con Google y Bing principalmente porque su bot es diferente con lo que aumenta nuestras posibilidades de éxito


Usaremos si conocemos datos de lo que queremos buscar asi> site:www.lawebabuscar.com "palabra clave"

Site nos permite filtrar a solo las URLs cacheadas de esa pagina.
"texto" Obliga a que este exactamente ese texto en la URL, decripción, meta o en el propio texto de la noticia.

Ejemplo practico:

Buscaremos wiki en pastebin que publicaban los datos de los antidisturbios UIP.


Vaya, esta borrado.... no tan deprisa vaquero. Google nos permite ver sus paginas en cache, que es el momento por el que paso el Bot (araña) y guardo como si fuera una captura de su estado, con lo que señalando "En cache", podremos ver un estado anterior.



Y este es el resultado:


Como veis, se puede recuperar en este caso todo el wiki publicado a la fecha que nos marca en la parte superior, lo que es un arma de doble filo, bueno para unas personas pero una maldición para otras, pero esto es Internet, y te tiene que gustar tal como es.

Disfrutad todo lo que podáis y Happy Hacking!!



No hay comentarios:

Publicar un comentario