La importancia de la calidad en los metadatos en la publicación digital

Uno de los objetivos que persigue cualquier sistema de publicación digital es brindar mayor visibilidad a los recursos que alberga. Esta visibilidad se logra a través de la correcta recopilación y organización de los documentos, así como a través del intercambio de datos entre plataformas, motores de búsqueda y agregadores de contenido. El intercambio de información entre este tipo de sistemas facilita que los usuarios de internet localicen de forma ágil y dinámica la información publicada.

En el mundo actual, cada vez es mayor la cantidad de información que se publica en formato digital, esto supone una serie de dificultades para el usuario final, ya que en la medida en que crece la cantidad de contenido disponible, crecen también las dificultades para buscar, filtrar y seleccionar documentos de alto interés, así como para identificar características importantes como la pertinencia del contenido, temáticas específicas que abarcan, derechos de autor y licencias con que cuenta el documento, formato técnico, fechas de publicación o fuente oficial que publicó el contenido.

En este contexto, resulta sumamente importante el uso de esquemas de metadatos que permitan describir claramente el documento, de tal forma que sea fácil de buscar e identificar por parte de los usuarios, ya que es necesario mantener en mente la premisa básica: En la medida que se utilicen más y mejores metadatos, los documentos serán más visibles y serán más fácilmente localizados por los usuarios de Internet.

¿Qué son los metadatos?

Los metadatos no son otra cosa que un conjunto estandarizado de descriptores, que permiten proporcionar al usuario final la información completa y clara acerca de un determinado documento.

Para ser considerados metadatos, estos descriptores deben cumplir con dos condiciones fundamentales:

1. Estandarización

Un esquema de metadatos debe ser reconocido como un estándar que haya sido adoptado a nivel internacional y que cuente con su especificación publicada por al menos una organización de normalización internacional.

Esto permitirá que al adoptar el esquema de metadatos, estos sean compatibles y puedan ser intercambiados entre diversos sistemas sin importar la plataforma, idioma o país en el que vayan a ser utilizados.

2. Cobertura

Por otro lado, es importante resaltar que un esquema de metadatos debe contar con la capacidad de describir diversos aspectos del documento, es decir, la descripción debe ir mucho más allá del contenido, además de que debe partir del hecho de que se está hablando de un documento digital, por lo que debe considerar aspectos y características propias de este tipo de archivos.

Es por eso que un esquema de metadatos debe cubrir cuando menos los aspectos de:

Contenido

Debe poder encontrarse información clara y completa acerca de la temática y tipo de contenido del que se trata.

Derechos

Debe poder describirse el tipo de licencia que rige el uso del contenido, así como el tipo de derechos con que cuenta, las personas u organizaciones que son los titulares de los derechos, etc.

Formato

Debe encontrarse información acerca del formato técnico del documento, como puede ser su ubicación permanente el web, su tamaño en bytes, el formato del archivo, etc.

¿Cómo se intercambian los metadatos?

La comunicación entre sistemas y motores de búsqueda se logra a través del uso del protocolo de intercambio de datos OAI-PMH (Open Archives Initiative – Protocol for Metadata Harvesting), el cual toma la información descrita en los metadatos del recurso para poder llevarla hacia plataformas de consulta externas.

En este proceso resulta fundamental el uso adecuado de un estándar para la descripción de los recursos almacenados en el sistema a fin de que la comunicación entre éste y cualquier motor de búsqueda se realice de forma óptima. Uno de los estándares más utilizados para la descripción de recursos en plataformas de gestión de documentos digitales es Dublin Core.

La Dublin Core Metadata Initiative (DCMI) es una iniciativa surgida en 1995 con el objetivo de diseñar un conjunto de descriptores fáciles que fueran entendibles tanto por humanos como por computadoras, permitiendo la organización y recuperación de diversos tipos de contenido a través del uso de un vocabulario común.

Para llevar a cabo este objetivo, Dublin Core emplea 15 metadatos básicos que permiten describir un recurso a nivel del contenido, el formato en que se encuentra y los derechos o licencias que lo rigen. A fin de llegar a una descripción más profunda del recurso, es recomendable el uso de cualificadores.                                               http://dublincore.org/documents/usageguide/qualifiers.shtml

A continuación compartimos algunas sugerencias para la descripción de los recursos utilizando una estructura de Dublin Core estandarizada:

Recomendamos:

Para el elemento dc.subject cuyo objetivo es describir los temas que aborda el recurso, utilizar una normalización o un vocabulario controlado haciendo uso de clasificaciones estandarizadas como Dewey, LCC, NLM y UDC.

Para el elemento dc.type cuyo objetivo es describir la tipología documental del recurso, utilizar una normalización basada en la clasificación que ofrece la DCMI http://dublincore.org/documents/2000/07/11/dcmi-type-vocabulary/ o bien emplear el estándar RFC6838 que describe los diferentes tipos de recursos en Internet http://www.iana.org/assignments/media-types/media-types.xhtml

Para el elemento dc.date cuyo objetivo es describir los diferentes sucesos relacionados con el ciclo de vida de un recurso, emplear los estándares para el uso correcto de fechas como el ISO 8601 http://www.iso.org/iso/home/standards/iso8601.htm o el esquema de descripción del DCMI para la definición de periodos específicos de tiempo que aplican a algún recurso http://dublincore.org/documents/dcmi-period/

Para el elemento dc.format cuyo objetivo es decribir las características las características físicas o técnicas de un recurso, emplear el estándar RFC6838
http://www.iana.org/assignments/media-types/media-types.xhtml

Para el elemento dc.language que describe el idioma en que se encuentra el contenido del recurso, utilizar estándares cómo el ISO639-2 que indica los códigos que deben usarse para la representación de los diferentes lenguajes alrededor del mundo. http://www.loc.gov/standards/iso639-2/php/code_list.php

Es muy importante recordar que el incremento en la visibilidad de los contenidos digitales que se publican va en función de la calidad de los metadatos que describen el recurso. En este sentido vale la pena dedicar el tiempo suficiente en el uso de vocabularios controlados y estándares de descripción, así como en el uso de los cualificadores necesarios para cada uno de los 15 elementos que describen los contenidos, el formato y los derechos del recurso publicado.

Fuente:

Araceli Olivo

eScire

0 comments on “La importancia de la calidad en los metadatos en la publicación digitalAdd yours →

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *