Herramienta para escanear metadatos y agruparlos en una nube de tags
Los metadatos, es la información insertada en los archivos por el software de edición o creación de los mismos, estés metadatos contienen información acerca de la creación del archivo como: nombre de autor, autores anteriores, nombre de compañía, cantidad de veces que el documento fue modificado, fecha de creación…
Los metadatos pueden tener varias aplicaciones como:
- En informática forense: Para demostrar en un juicio que unos archivos de imágenes pertenecen a una determinada cámara de fotos.
- En ataques a sistemas o servidores web: A través de los metadatos podemos obtener los nombres de posibles usuarios, sistema operativo, nombres de red… para después realizar un ataque de fuerza bruta.
Con la herramienta SCAN un gestor de contenido semánticos que permite escanear metadatos y agruparlos en una nube de tags. Combina las funciones de: búsqueda, análisis de textos, tagging y metadatos, para proporcionar una eficiente gestión de documentos personales. SCAN fue desarrollado para solventar problemas de organización del contenido personal y dar facilidades a la hora de hacer búsquedas en casos de sobrecarga de información. Pero sus posibilidades son muy amplias tanto para análisis forenses como para auditorias de metadatos.
Entre las características de SCAN destacan:
- Elimina los límites puestos por diferentes sistemas de almacenamiento. Los flujos de información de diferentes fuentes de búsqueda se agregan en un solo espacio semántico, explorable donde los: archivos, páginas web, correos electrónicos y otros elementos de contenido son igualmente documentos organizados por sus propiedades semánticas naturales, más que por su ubicación física.
- Un marco de metadatos unificado para: describir, clasificar y realizar anotaciones en los documentos.
- Permite hacer tagging, una forma más sencilla e intuitiva de organizar el contenido. Es posible etiquetar cualquier documento con los tags y navegar por la “nube de tags”.
- Potente motor de búsqueda de texto y metadatos.
- Es un software de código abierto, disponible de forma gratuita.
- Multiplataforma, independiente del sistema operativo y hardware del equipo.
- Está diseñado como un marco flexible fácilmente configurable para las necesidades específicas del usuario. Es extensible gracias a la integración de plugins, para nuevas ubicaciones y formatos de documentos.
Su motor de busqueda permiten agregar contenido de diferentes fuentes: carpetas locales, sindicación web, buzones de correo, marcadores del.icio.us y posiblemente otras ubicaciones que estén disponibles en los plugins. Un usuario sólo necesita una ubicación y la aplicación encontrara y agregara todos los documentos. A partir de ahí, las ubicaciones de los documentos agregados serán supervisadas para ver los cambios (nuevos documentos, modificados o eliminados) para mantenerlas monitorizadas hasta la fecha, y guardadas en un repositorio. El repositorio de documentos puede llevar registros de miles de documentos independientemente de su formato original. Un gran número de formatos de documentos populares es compatible de forma nativa, o bien a través de los plugins, incluyendo formatos como: HTML, PDF, OpenOffice, MS Office y mensajes de correo electrónico.
SCAN ofrece un rico conjunto de propiedades de metadatos asociados a los documentos, incluyendo: el título del documento, descripción, anotaciones, autor, fecha de creación y otros. Las propiedades se establecen automáticamente en el documento y se pueden añadir y editar rápidamente después. Las propiedades de los metadatos se pueden utilizar en las consultas de búsqueda para encontrar los documentos que coincidan con los criterios especificados. Además, algunas propiedades (autor, trayectoria, fecha e idioma) sirven como tags de navegación para recorrer los documentos. La colección de documentos está estructurado con un sistema de tags, similar a los servicios como del.icio.us o Flickr. Los tags son palabras clave que identifican documentos para una navegación rápida. Todas los tags juntos forman una taxonomía que representa la semántica del repositorio de documentos. La taxonomía se puede ver como una “nube de tags” para navegar por el repositorio de documentos.
SCAN tiene un potente motor para la minería y análisis de textos para descubrir la semántica de documentos y extraer los conceptos básicos del contenido. El análisis de texto simplifica enormemente el proceso de tagging. Ayuda a un usuario a recoger los términos más relevantes que identifican un documento y transferirlo como tags. Esto hace que el tagging manual de documentos sea tan simple como seleccionar los tags de los candidatos propuestos. Además, un usuario puede confiar el proceso de tagging al sistema, por lo que los documentos se pueden etiquetar de forma automática con los términos pertinentes.