¿Qué son los metadatos ?

Metadato es un término utilizado para describir datos que dan el tipo y clase de la información, es decir, son datos acerca de datos. En el contexto del Web, los metadatos como los índices y las URL´s son formados y almacenados principalmente para la implementación de motores de búsqueda.


¿Por qué surgieron los metadatos ?

Los metadatos surgieron debido a la gran diversidad y volumen de las fuentes y recursos en Internet. Esta gran diversidad hizo necesario establecer un mecanismo para etiquetar, catalogar, describir y clasificar los recursos presentes en la World Wide Web con el fin de facilitar la posterior búsqueda y recuperación de la información.


¿Cómo se crean los metadatos ?

Los metadatos pueden crearse de forma manual o de forma automática, o bien, mediante una combinación de ambos métodos. Los primeros programas que servían para construir hipertexto o elaborar páginas web sólo permitían navegar, ver, distribuir y enlazar las páginas mediante enlaces. Actualmente, la mayor parte de estos programas cuentan también con las herramientas necesarias para generar de forma automática tablas de contenido, para indizar páginas y para añadir metadatos.


Pero al margen de los tradicionales editores web, existen también una serie de herramientas y aplicaciones que permiten crear tanto metaetiquetas, como crear metadatos con distintos niveles de metainformación y funcionalidades. Hay programas muy sofisticados que son capaces de gestionar conocimiento, herramientas para crear tesauros, aplicaciones para desarrollar ontologías, mapas temáticos, etc; pero también existen herramientas mucho más sencillas cuya función primordial es crear metaetiquetas y metadatos.


¿Cómo se asocian los metadatos ?

1- Incrustando los metadatos dentro del propio documento: esto implica que los metadatos deben ser creados al mismo tiempo que se crea el recurso, a menudo por el autor. Generalmente se almacenan embebidos y codificados en la cabecera del documento y eso permite que esta metainformación sea transportada por el sistema a la vez que se transporta el contenido del documento.


2- Asociando los metadatos: por medio de archivos acoplados a los recursos a los que describen. La ventaja de los metadatos asociados se deriva de la facilidad relativa de poder manejar los metadatos sin cambiar el contenido del recurso en sí mismo. Estos metadatos persisten aunque el documento ya no esté accesible. Para su indización es preciso contar con herramientas específicas. Este tipo de metadatos se utiliza, sobre todo, para material multimedia, imágenes, etc. Una forma sencilla de crear metadatos asociados es a través del elemento LINK de HTML.


3- Metadatos independientes: los metadatos se mantienen en un depósito separado, generalmente una base de datos mantenida por una organización que puede o no tener el control directo o tener acceso al contenido del recurso. De esta forma, es mucho más fácil gestionar tanto los metadatos como los recursos -almacenarlos, mantenerlos, actualizarlos, convertirlos a otros formatos, etc.- y, además, es posible que múltiples conjuntos de metadatos pueden referirse al mismo recurso. Este es el método que suelen emplear muchas organizaciones para que sus datos no sean públicos, ya que de esta forma permanecen inaccesibles a los motores de búsqueda.


¿Qué son los metadatos Dublin Core ?

Dublin Core es un sistema de 15 definiciones semánticas descriptivas que pretenden transmitir un significado semántico a las mismas. Cada definición es opcional, puede repetirse y aparecer en cualquier orden.


Este sistema de definiciones fue diseñado específicamente para proporcionar un vocabulario de características "base", capaces de proporcionar la información descriptiva básica sobre cualquier recurso, sin que importe el formato de origen, el área de especialización o el origen cultural.


¿Cómo se clasifican los metadatos Dublin Core ?

  • Elementos relacionados principalmente con el contenido del recurso:

- Title(titulo)

- Subject (tema)

- Description (descripción)

- Source (fuente)

- Languaje (lenguaje)

- Relation (relación)

- Coverage (cobertura)


  • Elementos relacionados principalmente con el recurso:

- Creator (autor)

- Publisher (editor) y, otras colaboraciones

- Contributor (otros autores/colaboradores)

- Rights (derechos)


  • Elementos relacionados principalmente con la instanciación del recurso:

- Date (fecha)

- Type (tipo de recurso)

- Format (formato)

- Identifier (identificador)