miércoles, 1 de junio de 2011

Comprensión de EAD y sus posibilidades actuales

EAD (Encoded Archival Description) nació de la necesidad de buscar un lenguaje normalizado y accesible a nivel mundial para describir, estructurar e informatizar los instrumentos de descripción archivística.

Antes del EAD, se llegó al consenso de crear unas reglas de descripción archivísticas válidas para todo el mundo. De ahí nació la ISAD(G), que es un conjunto de reglas de descripción archivística multinivel con una gran jerarquización y un profundo nivel de descripción.

Una vez que se tuvo la ISAD(G) todavía estaba el problema de la gran descentralización y poca estandarización en la descripción archivística a nivel digital. Se buscó ayuda en lenguajes ya existentes que tuvieran la suficiente potencia y flexibilidad como para poder abarcar las descripciones fruto de la ISAD(G). Fue cuando se recurrió primero al SGML (Standard Generalized Markup Language) que fue el primer metalenguaje que surgió, pero debido a motivos de estandarización y a que su orientación no apuntaba hacia Internet finalmente se terminaría usando XML. Codificando un instrumento de descripción con XML podríamos aprovechar prácticamente todas las posibilidades de acceso y recuperación de información de la tecnología de redes.

EAD es, por lo tanto, una implementación más de XML pero orientada a la descripción archivística. EAD es un DTD auspiciado por la Library of Congress que recoge todos los apartados y subapartados de la ISAD(G) de una manera estructurada y totalmente jerarquizada, igual que su predecesora pero a nivel digital. Esta herramienta permite una estandarización de la descripción archivística totalmente basada en las reglas ISAD(G) ya establecidas y consensuadas pero extrapolándolas al ámbito informático y de las redes de comunicación.

El funcionamiento del EAD es como el de cualquier otro documento XML:

  • Usa códigos de marcaje (etiquetas) que proporcionan nombres para categorizar las partes del documento a describir.
  • Separa contenido de presentación, permitiendo que diferentes herramientas software puedan usar este contenido y adaptarlo a sus particularidades de presentación y manejo.

Para gestionar la presentación existe el XSL (eXtensible Stylesheet Language) una especificación complementaria a XML especialmente desarrollada para proporcionar estilo a los documentos XML.

Página de ayuda de EAD

Guía en español sobre EAD

Guía en inglés sobre recursos e implementación de EAD

A parte de la propia descripción de cada documento, EAD tiene una serie de elementos que arrojan más información sobre el propio documento en sí, su creador, de dónde procede, fechas de modificación, etc.

Una característica importante y muy útil que posee es la de enlazar un instrumento de descripción a copias digitalizadas de los materiales descritos o a cualquier otros recursos. EAD proporciona el elemento (Digital Archival Object), que permite navegar desde un documento a otros recursos o documentos asociados al primero, aumentando cuantiosamente su navegabilidad, accesibilidad y riqueza de información.

EAD se compone de tres pilares principales que son:

  • eadheader: información sobre el instrumento de descripción en sí mismo (su título, compilador, fecha de compilación)
  • frontmatter: para la publicación formal del instrumento de descripción. Se trata de información preliminar del documento: portada, preámbulo, dedicatoria, etc.
  • findaid: que proporciona la descripción del material archivístico en sí misma, además de la información contextual y administrativa asociada.

Dentro de estos pilares, existen una serie de subelementos que se ramifican y recogen todos los elementos correspondientes con su análoga la ISAD(G). A continuación muestro un esquema donde se presentan de manera jerárquica todos los elementos que componen la EAD:


Una funcionalidad importante en EAD es la de conectar el documento descrito con otros documentos de descripción o documentos descritos, lo que permite la interconexión y navegabilidad a niveles antes impensables entre diferentesrecursos dentro de la institución o incluso entre diferentes instituciones. Esta conexión la permite el elemento (extended reference).

Otra funcionalidad es de la EAD es la de la representación de la vinculación entre los diferentes niveles de descripción archivística. Presenta un elemento, "descripción de componentes subordinados" ("dsc") (en "archdesc") que permite incluir información sobre las unidades de descripción inferiores dependientes, jerárquicamente, del documento descrito.

Este elemento se utiliza de forma combinada con el elemento "componente" "c" que proporciona información particular sobre las unidades de descripción subordinadas y a su vez puede subdividirse en otros componentes tantas veces como así lo requiera la jerarquía de las unidades de descripción ("c01", "c02" , "c03", ...).

Los elementos de EAD pueden tener atributos dentro, que son cualificadotes del contenido de los elementos donde están. Proporcionan información o características adicionales de cada uno de ellos y la mayoría de ellos no son obligatorios, pero sí recomendables para alcanzar una mayor profundidad a la descripción y un correcto funcionamiento y entendimiento por parte de los interpretadores.

Existe un atributo en el EAD que me ha parecido especialmente reseñable: el “encodinganalog”, que sirve para relacionar cada elemento descriptivo con el correspondiente elemento ISAD(G), de esta forma, es muy fácil hacer exportaciones o generación automática de registros en ISAD(G) a partir de documentos descritos por medio de EAD. Ejemplo de “encodinganalog”:

Existen varios proyectos de gran envergadura que utilizan EAD como medio para gestionar sus contenidos, algunos son:

Sería por lo tanto muy conveniente que EAD se extendiera por todo el ámbito archivístico para que de esta manera se estandarizara la descripción archivística a nivel mundial en todos los sistemas de información. A nivel nacional, todos los archivos, bibliotecas y sistemas de información españoles deberían (si no lo han hecho ya) implementar en sus colecciones esta descripción a nivel digital para hacerla mucho más accesible al mundo y, en colaboración con el resto de instituciones, ya que esta tecnología lo permite por su gran flexibilidad, crear una gran red global de documentos descritos y accesibles.

Aún así, aparte de este tipo de proyectos EAD aporta muchas más posibilidades de las que se le habían atribuido en un principio, ya que al ser producto de XML, tiene todas sus ventajas y potencialidades.

Mediante esta herramienta, se podría conseguir la descripción de cualquier tipo de documento o fragmento de información relevante y que mereciera la pena ser conservado, descrito y localizable. Hablo de la información emergente en Internet. Existen numerosas herramientas y redes sociales en esta red de redes que aun no habiendo sido concebidas para tal fin, el uso que le han ido dando los propios usuarios ha propiciado que de ahí se genere información y documentos que son de gran relevancia ya no sólo informativa, sino también histórica e incluso probatoria.

Tal como expuse en mi reflexión anterior sobre XML, no importa cómo avance la información y su difusión, siempre podrá ser abarcable, identificable, descrita y compartida, ya que esta herramienta como es el EAD podrá funcionar a modo de pasarela entre la información bruta generada en la red y su procesamiento para que pueda ser útil y localizable.

Se podría aplicar la EAD para poder describir todos estos ítems, documentos o fragmentos digitales de una manera estandarizada y global para que fueran accesibles y localizables en cualquier lugar, en cualquier momento y por cualquier persona, y sobre todo, para que no se perdieran entre la vasta información que se genera día a día y que hace que todo lo anterior se vaya quedando enterrado bajo la saturación de información.

Parece utópico, pero observando bien esta información que se genera en Internet, presenta muchas similitudes con cualquier documento que se describa mediante ISAD(G), no importa cuántos subelementos tenga o de dónde proceda o los ficheros o recursos asociados que tenga, EAD tiene la estructura preparada para tal fin, con lo que cualquier documento podría estar perfectamente representado para su difusión a nivel mundial.

Cabe proponer por tanto una actuación colaborativa a gran nivel en la que se intenten "salvar" este tipo de documentos que se producen de manera sumergida hasta ahora y que puede que ahora sean localizables por los buscadores actuales, pero que en un tiempo se habrán perdido por toda la incesante producción de información.

Fuentes:

http://www.slideshare.net/dmaniega/ead-encoded-archival-description-archivos-en-lnea

http://www.hipertext.net/web/pag223.htm

http://www.loc.gov/ead/index.html

http://www.archivists.org/seagroups/ead/

http://rayuela.uc3m.es/~nogales/cursos/ead.html

http://www.archive-skills.com/links/links9.php

martes, 10 de mayo de 2011

XML: qué es, funcionamiento y relación con sistemas de gestión de información

XML (eXtensible Markup Language) es un conjunto de reglas (no de elementos fijos) que permite crear otros lenguajes de descripción mediante etiquetado. Es libre y gratuito y permite la descripción de documentos separando la estructura, el contenido y la presentación de éstos. Se decantó por el uso de este lenguaje ya que aunaba las características del SGML (Standard Generalizad Markup Language) y además estaba orientado para su uso en Internet y era más flexible.

Una defnición más profunda se puede encontrar a través de wikipedia: http://es.wikipedia.org/wiki/Extensible_Markup_Language


Se puede encontrar un completo tutoria le la Web de la W3C, la organización que trabaja por los estándares y el funcionamiento y uso de este tipo de tecnologías en Internet: http://www.w3schools.com/xml/default.asp ó http://www.desarrolloweb.com/manuales/manual-introduccion-xml.html en español.


Las grandes virtudes que tiene XML son la versatilidad y flexibilidad, pudiendo utilizarse para describir al nivel de profundidad que se desee cualquier documento de un sistema de información, siempre que se haga a partir de una información muy bien estructurada. (como es en el caso de la EAD respecto a la ISAD(G)).


Una parte clave es el DTD (Document Type Declaration - http://es.wikipedia.org/wiki/Definici%C3%B3n_de_tipo_de_documento), que especifica las reglas por las cuales el parser (o interpretador) debe analizar la estructura del documento y sirve para validar el documento XML.


El proceso de funcionamiento es que se declara un tipo de DTD (Document Type Declaration), que puede ser con una definición interna (en el propio fichero se especifican las regla que queramos) o externa, se hace referencia a una definición de reglas externa (normalmente se usa la de la W3C), y los elementos que se hayan definido en la DTD podremos usarlos a través de XML para etiquetar y estructurar un documento.


En los DTD se especifican los elementos que pueden aparecer en el XML así como el tipo de valores que pueden tener.


Una vez que se ha etiquetado un documento separando su contenido de su formato y presentación, le toca el turno al XSL (eXtensible Stylesheet Language - http://es.wikipedia.org/wiki/Extensible_Stylesheet_Language) de complementarse con el XML.


XSL se encarga de la parte del formato de XML, pudiendo dar forma de presentación y orden de sus diferentes elementos. Es decir, mediante XSL se va especificando cómo deben mostrarse al usuario final los diferentes elementos del XML.


Un recurso que explica detalladamente este funcionamiento además de otras iniciativas como EAD es esta presentación:

http://www.slideshare.net/dmaniega/ead-encoded-archival-description-archivos-en-lnea

A modo de resumen, los pasos serían:
  1. A partir de un sistema de información jerárquico creo un “Document Type Declaration” en el que especificaré cada uno de los elementos de este sistema y los valores y contenidos que pueden adoptar.
  1. Estos elementos definidos son los que servirán para “etiquetar” (a través de sus identificadores) la información. Para ello se usa el lenguaje de etiquetado XML. En cada uno de los documentos que estemos describiendo, se especificará que se va a usar la tecnología XML y el lugar donde se encuentra el DTD por el que se está guiando el XML.
  1. Una vez tenemos el “instrumento de descripción” con toda la información etiquetada correspondientemente se crea un fichero XSL que se aplica sobre el XML y en el que especificamos por una parte qué elementos del XML fuente son los que se mostrarán en un XML resultado y por otra, qué formato (aspecto) tendrán estos elementos.
  1. Combinando el archivo XML (que apunta a un DTD) y el archivo XSL, cualquier navegador podría “entender” y visualizar el documento presentándonos la información tal como nosotros la etiquetamos y con el formato que le indicamos.

A continuación muestro un ejemplo básico de XML con llamada a un DTD. Aunque existen muchos recursos en la red para aprender desde 0 a usar este lenguaje como este vídeo (y siguientes): http://www.youtube.com/watch?v=UcJFo-CQWTQ





(basado en http://flanagan.ugr.es/xml/xml.htm)


Para usos más avanzados de este lenguaje, existe una página en internet de snippets (trozos de código de programación reutilizables) con sección de XML: http://snipplr.com/all/language/xml



XML y Sistemas de Gestión de Información

Desde siempre la archivística se ha centrado en planificar y desarrollar Sistemas de Gestión de Información (SGI) dándole más importancia a los documentos y su descripción.


El gran cambio que se produce con las nuevas tecnologías como el XML y el DTD para su validación, consiste en que la importancia resida en las propias herramientas que pueden componer el SGI dando por hecho de que el documento va a ser totalmente abarcable y, principalmente, el uso que a éstas se les dé.


Gracias al uso de XML en estas herramientas, que es la tecnología imperante hoy en día, como las que puedan surgir de su evolución, no importa cómo avance la información y su difusión, siempre podrá ser abarcable, identificable, descrita y compartida, ya que estas herramientas funcionan a modo de pasarela entre la información bruta y su procesamiento para que pueda ser útil y localizable.


Los SGI pueden evolucionar de tal manera que cualquier documento (o conjunto de documentos), información o testimonio (digital o física) puedan ser “desmembrados” en fragmentos útiles, identificados y localizables y almacenados en bases de datos mediante estos metalenguajes, dando lugar a un gran acervo de información que puede ser consultado y compartido de manera global y en cualquier momento dadas las características de la red y de los recursos que en ella habitan.


Remitiéndome a este último punto, la combinación de estos recursos, como pueden ser redes sociales y herramientas asociadas a ellas, con la información que en ellas se pueda producir y los evolucionados SGI mencionados anteriormente apoyándose en ellas, pueden dar lugar a que información que antes tenía gran valor (ya sea histórico, actual o decisivo) y que se producía de manera “sumergida” pueda ser ahora visible y accesible desde cualquier sitio y por cualquier persona gracias a estas tecnologías. De igual manera, estas redes pueden contribuir a una difusión global sin precedentes de cualquier tipo de información y gracias a este tipo de tecnología como es el XML, global, fácil y estandarizada.


Se puede sacar en claro que todas las prestaciones y posiblidades que hay en herramientas ya existentes en la red y que en un principio no fueron concebidas para ello, tienen un uso potencial que se consigue combinandolas con tecnologías como el XML dando lugar a servicios hasta antes impensables.


Un ejemplo concreto sería el de Twitter, en el que hay ciertas actuaciones a través de esta red decisivas para eventos importantes en nuestra época y que pueden haberse perdido, desperdiciándose su valor informativo, histórico o simplemente aclaratorio. Dentro de esta red, y gracias al XML, las posibilidades que se abren son muy grandes, ya que se pueden crear sistemas de información que recojan información de manera selectiva y en tiempo real, incluso con filtrado geográfico por ejemplo.


¿Cómo pueden enfocarse entonces las herramientas de estos SGI de ahora en adelante? haciendo más hincapié a la implementación y uso de estas tecnologías para que puedan procesar el contenido de su información, sea del formato que sea, en todos sus niveles (ya que XML soporta la descripción jerárquica por niveles) y compartirlo, ya no sólo con todo el que lo necesite, si no entre el resto de SGI, de manera que se facilite la normalización de contenido y de descripción entre éstos.

miércoles, 6 de abril de 2011

De qué manera la 2.0 afecta a los sistemas de información

El hecho de la aparición de la Web 2.0 ha supuesto un cambio radical e impresionante en los sistemas de gestión documental y sus expectativas de futuro.

La sustancial diferencia que hay ahora radica en que todos los usuarios pueden ser productores de información, no como antes, en la que la producción dependía únicamente de algunos actores que la diseminaban entre todos los que “escuchaban”.

Esta masificación de información que existe podría registrarse, etiquetarse y ordenarse de manera que se creara un sistema de gestión documental gigantesco en el que pudiéramos encontrar prácticamente TODO el contenido que se produce en todo el planeta.

Y es que esta idea, por utópica que parezca, es posible, y de esta manera cambiaría la concepción de la historia al poder estar todo documentado, desde un tweet hasta una foto del siglo 18 (o actual). Los historiadores del futuro podrían conocer con total detalle lo ocurrido años atrás, con todo tipo de información y de formatos. El velo de misterio y sombra que siempre ha llevado de lastre la historia por falta de documentación se eliminaría ahora, dejando llano el camino de la investigación histórica y de nuestro conocimiento antropológico global a partir de aquí.

TODO podría estar registrado y ordenado para ser localizable, lo cual supone un gran reto para los gestores de información, pero a la vez sería el mayor resultado que se haya podido imaginar en toda la historia. Es vital por tanto definir unos protocolos y métodos para organizar esta información lo suficientemente robustos y potentes como para poder abarcarla toda, de aquí la importancia del EAD y del XML.

Si bien es cierto que esta tarea de documentación de toda la información que se produce en la red no es nada fácil. Haría falta la colaboración de muchas partes para poder conseguir un sistema de gestión documental que soporte y gestione tal cantidad de información, ya que cada pequeño comentario, cada tweet, cada imagen o cada post de un blog (entre muchos otros tipos de documentos) deberían ser considerados como ítems localizables. Esto es posible a lo mencionado anteriormente: el XML. Creo que, independientemente de la tecnología, harían falta recursos logísticos y la voluntad de colaboración de diferentes actores que aporten los recursos necesarios para tal empresa.

martes, 22 de marzo de 2011

Web 2.0

Entre el mucho material que intenta explicar qué es la Web 2.0, me he decantado por estos vídeos y enlaces que creo que, en conjunto, lo pueden resumir bien:


Qué es la Web 2.0




Web 2.0 explicada sin palabras


Otra página Web que lo explica: La Web 2.0 en 23 pasos

Lo que se puede concluir de todo este material, en definitiva, es que la Web 2.0 representa una interacción y accesibilidad a la información como antes jamás se había conocido.

Gracias a la Web 2.0, los usuarios de todo Internet se convierten ahora en productores de información, no únicamente en consumidores de páginas que no permitían ninguna comunicación en ambos sentidos. Es decir, la producción y el consumo de información ahora es horizontal, no jerárquica. Todos pueden crear, todos pueden opinar, todos pueden responder.

Son populares una serie de herramientas características de la Web 2.0 como Flickr, Google Maps, Facebook, Twitter, etc. que hacen posible la interconexión entre todas las personas alrededor del mundo mediante diferentes tipos de recursos.

Toda esta situación que se ha generado en Internet ha cambiado por completo los fundamentos establecidos hasta ahora haciendo que se tenga que replantear por ejemplo (y esto va en relación con nuestra asignatura) a manejar el masivo contenido que ahora se genera y que se generará. Es por ello que hay que tomar conciencia de que la información debe de ser correctamente gestionada, si no, se perderá con tanto descontrol.

martes, 8 de marzo de 2011

Notas sobre "Internet y la sociedad red" de Manuel Castells (2003)

Algunas notas

- Internet creó un nuevo modelo de sociedad.

- En un principio existen tres núcleos que componen Internet según Castells: el núcleo empresarial, el núcleo libertario y el núcleo científico.
(a pesar de las creencias, no fue el núcleo empresarial el que originó Internet).

- Internet va creciendo y evolucionando por medio del feedback de los propios usuarios, que le dieron una aplicación diferente a la que tenía en un principio (servir como comunicación entre los principales centros científicos e investigadores). Se hacía un desarrollo paralelo en diferentes países.

- Internet se compuso casi desde el principio de organismos y herramientas libres, es decir, de acceso abierto a cualquier usuario, esto fomentó su desarrollo y expansión hasta límites insospechados en ese momento.

- Las tecnologías se establecían por su utilidad y su uso social, no porque hubieran sido creadas específicamente para tal fin.

- Los usuarios se concentran más por el mundo “desarrollado”. El resto de países en vías de desarrollo están por llegar, y esto supone que cuando entren en Internet, estará todo montado y estarán en una posición inferior ya que no han participado en la formación de la red y las tecnologías usadas.

En mi opinión, ésto con los años habrá ido cambiado, ahora habrá más participación de muchos más países, ya que cada vez hay más usuarios, y no sólo de los países desarrollados ya que la informática cada vez es más asequible.

- Los principales proveedores se concentran en las zonas metropolitanas e importantes, donde hay más conocimiento, información que ofrecer, así como la tecnología suficiente para llevarlo a cabo.

- Es obvio que la sociedad no se haya disgregado debido a poder trabajar en sus casa por Internet. Por naturaleza, el ser humano es gregario, y las ciudades importantes, desde la antigüedad, han ido creciendo porque son el núcleo de toda la información, conocimiento, servicios y ocio que pueda necesitar cualquier persona. Es lógico que Internet, que se alimenta de todo ésto, lo que haya hecho sea potenciar esta situación haciendo que cada vez más personas se apeguen al “núcleo tecnológico” y, por tanto, al núcleo social.

- La nueva divisoria digital de la que habla Castells en el artículo si es algo presente hoy en día también, y es que la capacidad de los que han conocido Internet y sus tecnologías siendo ya adultos es difícil de mantener o superar incluso a la capacidad innata que puedan tener los niños y estudiantes menores que han crecido (y nacido incluso) con Internet como base de comunicación.

No es raro ver ahora a un niño o niña pequeño con un móvil conectado a Internet, cuando los más mayores jugaban a la pelota en el parque a esa edad. Esta iniciación tan temprana crea una habilidad innata para manejar todo el amasijo tecnológico que hay (y que habrá), que a los que lo han conocido más tarde les costará mucho más.

- Internet ha cambiado el modelo de empresa. Actualmente todas las empresas tienen que tener una implicación en Internet, si no, no serán visibles para el resto del mundo, ya que el resto del mundo tiene los ojos puestos en Internet principalmente. Aparte de ésto, las ventajas que ofrece hacer una empresa virtual son indiscutiblemente beneficiosas.

Como se comenta en el artículo, la logística de una empresa puede ser muy limitada, pero el servicio que ofrece gracias a Internet puede ser muy amplio, con lo que los beneficios son muy lucrativos.

- Internet tambiñen ayuda al cambio en la economía mediante los mercados bursátiles electrónicos. La economía crece y se hace más compleja e instantánea.

- La creación de empresas se basa en criterios diferentes, ahora buscan la anticipación de servicios y su valorización en Internet.

- Es cierto que Internet atenta contra la privacidad de los usuarios ya que es posible acceder electrónicamente (si lo desean los oportunos organismos oficiales) a cualquier ordenador conectado a esta red de redes.

Internet y relaciones sociales

- Hay un punto sobre la sociabilidad en Internet que no termina de convencerme, sí es verdad que para el que tiene un círculo social desarrollado, le ayuda a fortalecerlo e incluso a hacerlo crecer, pero el problema está para el que apenas tiene círculo social. En muchos casos, el individuo se encierra en su mundo virtual y se “socializa” nada más que a través de Internet. No lo usa como herramienta para poder estrechar lazos con nuevas personas físicamente. Me extraña realmente que Internet aísle a quien también está aislado en la realidad, cuando normalmente pasa todo lo contrario. Internet siempre tiene un hueco para todos.

Sí es verdad que si el individuo tenía esta predisposición, Internet no ha tenido la culpa, pero sí ha podido facilitar que no busque estrechar lazos como se ha hecho desde siempre: en nuestros círculos de contacto cotidianos.

- Sí es cierto que Internet usado correctamente y no de forma banal puede ser muy útil y fructífero. Una prueba de ello es la docencia on-line, estar al día de noticias casi al instante (Twitter) o poder tener todos los trabajos o apuntes a disposición en cualquier sitio a través de Internet (Google Docs).

- Internet sirve de apoyo para las movilizaciones fundadas en base a valores concretos, no a asociaciones institucionalizadas. Este apoyo se debe a la capacidad de ser un medio de comunicación instantáneo y de permitir manifestar una posición de manera desafiante para que los demás apoyen la iniciativa o no.

- La falta de comunicación a doble vía en la política de la que se habla en el artículo se ha visto un poco paliada por las nuevas herramientas de interacción social, donde los políticos han conseguido acercarse hasta niveles antes inpensables con las personas. Aunque si bien es cierto que es la sociedad la que cambia a Internet y no al contrario.

- En los medios de comunicación también ha influído Internet, y es que éstos tienen la posibilidad de comunicarse a tiempo real con las personas para solucionar dudas o proveer información. Una nueva manera de estar informado.

También se permitirán los canales de comunicación por parte de cualquier persona. Esto plantea el problema de la credibilidad. ¿Cómo se construye una persona credibilidad no teniendo una marca de prestigio que lo avale?

A continuación dejo algunos links con infografías sobre Internet que me han resultado interesantes en su momento y que refrescan algunos datos que se mencionan en el artículo de Castells:

http://www.janetbravo.com/2010/08/como-funciona-internet/
http://mashable.com/2010/02/02/state-of-the-internet-image/
http://www.focus.com/images/view/48564/
http://freeform101.org/wp-content/social-media-count_full_500w.jpg

[Fuente: http://ow.ly/477r8]