jueves, 25 de septiembre de 2014

METAGOOFIL: EXTRACTOR DE METADATOS

METADATOS.

El concepto de metadatos varia un poco. Googleando el asunto pueden entronarse definiciones como:

"...literalmente «sobre datos», son datos que describen otros datos..."

"...metadato es toda aquella información descriptiva sobre el contexto, calidad, condición o características de un recurso, dato u objeto que tiene la finalidad de facilitar su recuperación, autentificación, evaluación, preservación y/o interoperabilidad...."

"...es más que un dato estructurado sobre la información, o sea, información sobre información, o de forma más simple, datos sobre datos..."


En esencia es lo mismo... datos de los datos... En este particular contexto datos que podemos encontrar detrás de documentos específicamente en los formatos  pdf,doc,xls,ppt,docx,pptx y xlsx.

METAGOOFIL.

Metagoofil puede ser descargado aquí. Procedí a probar la herramienta y opte por bajar la versión metagoofil-2.2.tar.gz, pero, me tope con un par de problemas al intentar ejecutarla y buscando no encontré muchas soluciones (tampoco busque mucho que digamos :P).  En uno de los foros recomendaban simplemente tomar la versión blackhat, metagoofil-2.1_BH2011_Arsenal.tar.gz, lo que realice y se ejecuto sin problemas. No tiene mas gracias que simplemente descomprimir los archivos posicionarse en el directorio contenedor y ejecutar:


Aunque se ejecuto de forma "correcta", marco problemas en la descarga de los archivos:



Buscando un poco observe que al parecer era un problema algo común. Encontré una solucion sugerida aquí. El correctivo implica cambiar en el archivo downloader.py la linea:


self.url=url por self.url=url.replace("/url?q=", "", 1).split("&amp")[0]



Realizado el cambio procedí a ejecutar de nuevo sin problemas:


En Kali Linux no fue necesaria ninguna corrección. Aquí como en Windows es necesarios posicionarnos en el directorio contenedor (usr/share/metagoofil):






Revisemos un poco los parámetros que usa:

-d: Dominio para buscar
-t: Archivo a descargar(pdf, doc, xls, ppt, odp, ods, docx, xlsx, pptx)
-l: Límite de los resultados de la búsqueda (por defecto 200)
-h: Trabajo con documentos en el directorio (uso “sí” para el análisis local)
-n: Límite de archivos para descargar
-o: Directorio de trabajo
-f: Archivo de salida

A modo de ejemplo lo ejecutaríamos de la siguiente forma:

python metagoofil.py -d dominio_objetivo.com -t pdf,doc,docx,xls,xlsx -l 10 -n 5 -o C:\Dwl -f C:\Dwl\Data.html

Desglosándolo:

python metagoofil.py 
-d dominio_objetivo.com - Sitio de empresa. organización... lo que sea, a revisar.
-t pdf,doc,docx,xls,xlsx - Buscaremos por archivos de Excel, Word y PDF´s.
-l 10 - Solo tomaremos los primeros 10 resultados.
-n 5 -Descargaremos solo los primeros 5 archivos encontrados.
-o C:\Dwl -Directorio de trabajo. Donde se descargaran los archivos.
-f C:\Dwl\Data.html - Nombre de creación y asignación para el reporte.

El resultado queda almacenado en un archivo HTML que nos presenta los siguientes detalles:

-Nombres de usuario.
-Versiones de software.
-E-mails.
-Rutas de archivos.
-Detalle por archivo.

Información que puede ser usada como reconocimiento para preparar ataques de fuerza bruta o buscar vulnerabilidades en base a las versiones de software... entre otras cosas.

CONCLUSIÓN.


Metagoofil es excelente para la extracción de metadatos si consideramos que, escrita en Python permite su uso en distintos sistemas operativos. Me me resulto un poco limitada comparándola con FOCA, lo que no puedo evitar ya que jugué primero con ella :P. Aun así me decidí por probar esta herramienta debido a que ando un poco entrado en Python y desbaratar código y estudiarlo me ayuda... me regresa a mi infancia donde solía desbaratar autos a control remoto, radios, mini videojuegos (de esos baratos como este...) y demás cosas- que tire la primera piedra quien en algún punto no desarmo su control de nintendo para "limpiarlo" por que los botones ya no funcionaban igual).Personalmente para una tarea de extracción de metadatos me quedaría con FOCA... de la que después hablare.

REFERENCIAS:

-https://code.google.com/p/metagoofil/
-https://metagoofil.googlecode.com/files/metagoofil-2.2.tar.gz
-http://www.edge-security.com/metagoofil.php
-http://www.elladodelmal.com/2009/05/libextractor-metagoofil-foca.html
-http://www.hipertexto.info/documentos/metadatos.htm
-http://es.wikipedia.org/wiki/Metadato
-http://www.sedic.es/autoformacion/metadatos/tema1.htm
-http://www.backtrack-linux.org/forums/showthread.php?t=56868
http://christophermcarver.wordpress.com/tag/metagoofil-py/

No hay comentarios:

Publicar un comentario

Nota: solo los miembros de este blog pueden publicar comentarios.