Digitalización del Patrimonio Audiovisual y Análisis Documental

Digitalización del Patrimonio Audiovisual y Análisis Documental: La utilización de metadatos en el tratamiento de los documentos de televisión
2003
Félix del Valle Gastaminza

Introducción

La digitalización de los procesos, sistemas y materiales audiovisuales está provocando cambios importantes en el trabajo de documentación. Los documentalistas se enfrentan a los nuevos retos que la evolución tecnológica plantea; son retos que afectan a todo el conjunto de actividades relacionadas con el patrimonio documental, desde su propia constitución y organización hasta las estrategias dirigidas a su valorización y a su difusión pública. Tras revisarlos, el trabajo se centra en el cambio de paradigma en el proceso de análisis documental que la digitalización provoca y en las nuevas herramientas intelectuales que los documentalistas han de utilizar en un futuro próximo.

Patrimonio Audiovisual

Los documentos audiovisuales se sitúan en el núcleo de un amplio conjunto de materiales, objetos e informaciones recopilados por los archivos audiovisuales que se denomina de manera genérica Patrimonio audiovisual. Éste incluye, según la definición de UNESCO, los siguientes materiales:
1. Sonido registrado, radio, cine, televisión, video o cualquier otra producción que comprenda imágenes y/o sonido registrado, estén o no principalmente orientadas a su difusión pública
2. Objetos, materiales, obras relacionados con los medios audiovisuales desde un punto de vista técnico, industrial, cultural, histórico; esto incluirá material relacionado con la industria cinematográfica, de radio y televisión y de grabación musical, como textos, guiones, fotografías, carteles, materiales publicitarios y objetos como equipos técnicos o vestuario
3. Conceptos como el mantenimiento de equipos y entornos de trabajo en desuso asociados con la reproducción y presentación de estos medios.
Los archivos audiovisuales toman esta definición de Patrimonio con sus propios parámetros para adaptarla a su situación – por ejemplo, mediante una calificación geográfica, una limitación temporal, una especialización temática o documental, o una adscripción empresarial…

Archivo Audiovisual

Un archivo audiovisual es una organización o departamento de una organización dedicado a la colección, gestión, preservación y acceso a una colección de documentos audiovisuales y al patrimonio audiovisual.
Hay dos aspectos clave:
• Un archivo audiovisual es una organización y no debe confundirse con una persona privada ni una colección privada.
• El principal objetivo de un archivo audiovisual es la realización de tareas de colección, de gestión, de conservación y de acceso al patrimonio audiovisual del que se ocupen, y estas no son actividades incidentales entre otras. Además se ocupa de todas esas tareas, no de algunas de ellas, lo que implica que colecciona materiales en formatos adecuados para su preservación y para su consulta.
Los archivos y centros de documentación de televisión contienen principalmente un inventario de programas y fragmentos seleccionados de televisión, en soporte cinematográfico y videográfico y grabaciones de sonido. Se trata de departamentos dependientes de organismos de televisión, que pueden ser desde grandes cadenas hasta pequeñas emisoras locales de televisión o productoras privadas. Su objetivo es normalmente disponer de un recurso activo al servicio de la producción de programas y la actividad comercial y administrar un activo empresarial diverso. Se ofrece a los clientes – ante todo “a los de la casa”- servicios de información, copia, acceso y otros, pero también pueden existir servicios de acceso para el público. Los fondos también comprenden materiales “en bruto”, como entrevistas y efectos sonoros, y materiales accesorios, como guiones o documentación de programas. También deberán asumir la responsabilidad señalada en la definición anterior sobre la conservación y mantenimiento de los equipos necesarios para hacer accesibles todos los documentos conservados.

Impacto de la digitalización.

La tecnología digital ha revolucionado a todo el conjunto de las operaciones y trabajos de archivo audiovisual:

• La conservación.
A medio plazo supondrá la desaparición definitiva de los soportes magnéticos y su sustitución por soportes ópticos y otros.
Las capacidades de almacenamiento, de transmisión y de tratamiento aumentan de manera considerable a la vez que se produce una reducción de los costes.
El archivo cambia su posición y deja de estar al final del ciclo como depósito y se integra en el proceso de producción.
• Catalogación de los documentos audiovisuales: Gestión de los datos asociados.
Revolución en las herramientas y procesos.
Revolución de los métodos documentales de tratamiento e indización de imágenes
Evolución de los tratamientos técnicos y jurídicos.

• La comunicación.
A medio plazo, trabajo en red: consulta en tiempo real con telecarga y pago en línea.
En 5 ó 6 años el conjunto de las transacciones se desarrollará en entorno web.
Desarrollo de nuevos servicios a través de agentes inteligentes.
Aumento potencial de los usuarios.

Reorganización de la gestión de los archivos audiovisuales.

• Constitución de fondos digitales: Digitalizar los fondos existentes, poner en marcha un sistema de captura digital, organizar el almacenamiento en los soportes informáticos adecuados.
• Preparación de herramientas evolucionadas para la explotación de los materiales: Indización de los datos documentales, jurídicos y comerciales; constitución de ofertas temáticas.
• Planificación de la distribución en línea, a través de Internet, mediante la creación de nuevos procedimientos y métodos de trabajo, buscando nuevos clientes, nuevas competencias.
• Adaptación de la formación y el reciclaje de los profesionales.

Los servidores de vídeo digital en el centro del proceso de producción audiovisual.

En el centro de todo el proceso de producción de programas de televisión se sitúan los servidores de vídeo, que son sistemas informáticos especializados dotados de una gran capacidad de almacenamiento capaces de permitir la circulación de varios flujos digitales continuos y simultáneos de vídeo a diversos clientes a través de una o varias redes. Su descripción nos permite ver hasta qué punto el archivo digital, es decir, la documentación, desde nuestro punto de vista, se sitúa en el centro del proceso de producción en televisión.

Almacenamiento

Juke-box y robot Almacenamiento en línea

Discos duros Motor de transferencia

Bases de datos
Gestión de red
Gestión de almacenamiento

Interfaces y redes

Un servidor de video permite en primer lugar almacenar. Debe disponer en principio de una gran capacidad de almacenamiento pues el video profesional ocupa mucho espacio. El almacenamiento de datos se realiza sobre discos duros que permiten el acceso múltiple, instantáneo y aleatorio a los datos digitales que contienen. Este tipo de almacenamiento se denomina almacenamiento. Se puede apoyar igualmente sobre un depósito o juke-box de CD-Rom o DVD o de cintas magnéticas de datos de gran capacidad gestionadas por uno o varios robots. Este tipo de almacenamiento, denominado near on line tiene una capacidad ilimitada en la práctica pero es de acceso más lento.
En segundo lugar es una máquina informática, un motor de transferencia que permite a los clientes conectados acceder a los sistemas de almacenamiento, sea para escribir datos sea para leerlos. Para ello integra un conjunto de programas informáticos necesarios para el funcionamiento del servidor: Sistema de explotación, gestión de almacenamiento, de redes, de base de datos, de derechos de acceso de los clientes, de facturación, etc. Las demandas de los usuarios llegan al motor de transferencia por red. Este examina los derechos de acceso y le facilita los datos requeridos vía red también.
Las redes, por último, podrán ser locales o abiertas.
En cuanto a las características principales que hay que tener en cuenta para un servidor de video hay que señalar la capacidad de almacenamiento, el tiempo de acceso, la velocidad de transferencia de datos hacia los clientes, el número de clientes simultáneos que el sistema admite y el modo de reparto, el grado de interactividad y otros parámetros como la fiabilidad, la seguridad de los datos, la posibilidad de evolución de la arquitectura, la conformidad a normas y standards o aplicaciones que permite.

Paradigma clásico del análisis documental

En la cadena documental el análisis documental de contenido consiste en el resumen, en texto libre, y la indización, en lenguaje controlado, de los documentos. Esto permite el acceso al contenido del documento con el objeto de recuperarlo, explotarlo y difundirlo. Una vez identificada la unidad documental que debe ser catalogada se trata de obtener una representación de la misma que sea manejable por un sistema automático. En televisión se trabaja con una cierta diversidad de unidades documentales, que además, en ocasiones, son interdependientes. Es el caso de los programas informativos, considerados como unidad, y las noticias que los integran. O estas mismas noticias, sus premontajes y los materiales brutos utilizados para realizarlas.

Información “bibliográfica”: Datos de creación y de emisión. En referencia al documento completo
Información técnica. Parte se refiere al documento completo pero también al documento segmentado
Información del contenido: Resumen, Minutado, Indización. Segmenta el documento, que puede suele representarse globalmente (descriptores y resumen) y jerárquicamente (minutado)

La operación de indización y representación de material de TV sigue los pasos siguientes:
1. Segmentar el video jerárquicamente en segmentos, secuencias y planos. ( Un plano es una toma continua de cámara. Una secuencia está compuesta por uno o más planos que presentan diferentes tomas del mismo acontecimiento con una relación espacial y temporal. Un segmento está compuesto por una o más secuencias relacionadas.)
2. Describir la información video bibliográfica completa – Título/s, autor/es, fechas, datos de publicación/edición, formato, duración, etc
3. Describir cada segmento – TCR (Time Code Recording) del frame de comienzo, duración, descripción textual.
4. Describir cada secuencia – TCR (Time Code Recording) del frame de comienzo, duración, descripción textual.
5. Describir cada plano – TCR (Time Code Recording) del frame de comienzo, duración, descripción textual.
Para realizar todas estas operaciones el documentalista tiene que ver el documento completo a veces más de una vez, tomando notas y sintetizando el contenido sonoro y visual para transformarlo en texto. Tiene que atender a la esencia del contenido y detectar cómo se ha expuesto en el documento; localizar los temas, personas y lugares relevantes; observar los aspectos formales y compositivos reseñables. El resultado final se expone en un registro catalográfico de una base de datos integrado por campos especialmente diseñados para los documentos en cuestión.

Un ejemplo muy sencillo incompleto en su desarrollo sería el siguiente:

PROG: El Semanal. TIT: El Ojo público. SIGN: BTC009675. FECHEM: 19980814
AUT: Luis Ortega (ED); Ana Silas (REP); Elena Dueso (REP).
RES: El, ojo público: La instalación de cámaras de video en lugares públicos para controlar los disturbios en el País Vasco reabre un debate ya planteado: la seguridad y la protección de los derechos fundamentales. En el reportaje se analiza la experiencia llevada a cabo por tres ayuntamientos catalanes que tienen instaladas videocámaras desde hace varios años para el control de la seguridad ciudadana.
PLATEM: /DERECHOS FUNDAMENTALES/ /PRIVACIDAD/ /SEGURIDAD CIUDADANA/ /VIDEOVIGILANCIA/
PLALUG: /VILASSAR/ /CANET DE MAR/ /CALAFELL/
PLAPERS: /CARRILLO, MARC/
CONT: (21:17) a (34:00). “El ojo público”.
(21:21) SEG Cámaras de videovigilancia en las calles de Calafell (Tarragona). (22:36)
(21: 25) PG Gente paseando. Automóviles detenidos en un semáforo.
(21:38) DP Cámaras instaladas en puntos estratégicos.
(22:06) PM Marc Carrillo, Catedrático de Derecho Constitucional de la Universitat Pompeu Fabra expone los pros y los contras legales y constitucionales de la videovigilancia./ (24:24)/ (25:45)/

Un nuevo paradigma.

En los centros de documentación de televisión se está comenzando a utilizar nuevos programas y tecnologías que permiten automatizar algunas de las operaciones descritas hasta aquí y plantear nuevas formas de representación. Estas tecnologías utilizan técnicas avanzadas de análisis de imagen y sonido que son capaces de comprender automáticamente la señal de video. Detectan cambios de plano y movimientos de cámara, y generan un storyboard de fotogramas (keyframe images). Simultáneamente, extrae cualquier texto presente en la señal de video. Transforma la señal de audio en texto e identifica así palabras, hablantes, etc. Toda la información que genera es susceptible de contrastarse con un lenguaje documental incluido en el sistema y, por supuesto, es susceptible de revisión y ampliación por un documentalista.
Estos programas no generan ya un solo registro por documento, sino que aprovechan la segmentación y jerarquización propia del documento para obtener un registro matriz del que dependen otros miniregistros con sus correspondientes “metadatos”.Debe tenerse en cuenta que el TCR actúa como señal física que permite ir automáticamente al punto del documento que nos interesa.

Primer nivel de metadatos: Datos bibliográficos globales del documento
Primer nivel de metadatos: Datos técnicos globales del documento.
2º nivel de Metadatos: Correspondientes a este Key frame: Contenido, descriptores, información visual o sonora.
TCR: 01:00 PM Marta Guiñol (Presentadora) explica la relación entre Elvis Costello y Elvis Presley
DUR: 45″

Metadatos correspondientes a este Key frame: Contenido, descriptores, información visual o sonora.
TCR 01:45 PP Elvis Costello, músico británico, presenta su nuevo disco en el que incluye una versión de un tema de Elvis Presley.
DUR: 45″
PLAPERS /Elvis Costello/.

Metadatos correspondientes a este Key frame: Contenido, descriptores, información visual o sonora.
TCR 02:30 PE Elvis Presley, intérprete estadounidense de Rock and Roll en un concierto en Hawaii en 1966 cantando “Love me tender”
DUR: 45″
PLAPERS /Elvis Presley/
PLATEM /Rock and Roll//Actuaciones en directo/

El resultado es que los niveles de descripción vienen determinados por el contenido; la unidad documental clásica se disgrega y sólo es perceptible si es necesaria. La recuperación es mucho más precisa, el índice de relevancia aumenta y el acceso físico a la documentación solicitada es mucho más rápido.

Normalización de la representación en Internet.

El enorme crecimiento de la información audiovisual en Internet exige el diseño de herramientas capaces de facilitar la indización, recuperación, obtención y revisión de datos audiovisuales. El desarrollo de normas de metadatos orientadas al contenido aplicables a documentos multimedia puede facilitar la tarea de diseño de los ingenios de búsqueda de información multimedia en la WWW. Revisaremos dos propuestas de normalización, integrables entre sí. Los Metadatos del Dublin Core y la norma MPEG-7.

Descripción de los elementos Dublin Core.

1. Título
Etiqueta: DC.Title
El nombre dado a un recurso, usualmente por el autor. Si el documento forma parte de un programa de TV es el nombre del programa pero también el título específico del documento si o tiene.
2. Autor o Creador
Etiqueta: DC.Creator
La persona u organización responsable de la creación del contenido intelectual del recurso. Por ejemplo, los autores en el caso de documentos escritos, artistas, fotógrafos e ilustradores en el caso de recursos visuales. La autoría en televisión es compleja, colectiva y habría que acordar cómo asignarla.
3. Subject y Claves
Etiqueta: DC.Subject
Los temas del recurso. Típicamente, Subject expresará las claves o frases que describen el título o el contenido del recurso. Se fomentará el uso de vocabularios controlados y de sistemas de clasificación formales. Por ejemplo Controlled vocabularies, thesauri and classification systems available in the WWW. DC Subject
4. Descripción
Etiqueta: DC.Description
Una descripción textual del recurso, tal como un resumen o un minutado en el caso de un documento o una descripción del contenido en el caso de un documento visual.
5. Editor
Etiqueta: DC.Publisher
La entidad responsable de hacer que el recurso se encuentre disponible en la red en su formato actual, por ejemplo la empresa editora, un departamento universitario u otro tipo de organización. En la televisión sería la empresa responsable de la producción del documento.
6. Otros Colaboradores
Etiqueta: DC.Contributor
Una persona u organización que haya tenido una contribución intelectual significativa en la creación del recurso pero cuyas contribuciones son secundarias en comparación a las de las personas u organizaciones especificadas en el elemento Creator (por ejemplo, editor, ilustrador y traductor). La coordinación de esta área con la de Creator es muy importante en la documentación de televisión.
7. Fecha
Etiqueta: DC.Date
Una fecha en la que el recurso se puso a disposición del usuario en su forma actual. Esta fecha no ha de confundirse con la que pertenece al elemento Coverage, que sería asociada con el recurso sólo en la medida en que el contenido intelectual está de algún modo relacionado con esa fecha.
Recomendamos la utilización de uno de los formatos definidos en el documento “Date and Time Formats”, http://www.w3.org/TR/NOTE-datetime basado en la norma ISO 8601 que incluye, entre otras, fechas en el formato AAAA y AAAA-MM-DD. De esta forma la fecha 1994-11-05 correspondería al 5 de Noviembre de 1994.

8. Tipo del Recurso
Etiqueta: DC.Type
La categoría del recurso, por ejemplo página personal, romance, poema, diccionario. Para asegurar la interoperabilidad, Type debería ser seleccionado de entre una lista de valores que actualmente se encuentra bajo desarrollo en un grupo de trabajo.
En http://sunsite.berkeley.edu/Metadata/types.html se puede consultar el estado actual de la discusión en torno a este tema. Para imagen se estudian las categorías siguientes:

Image
• Moving
o Animation
o Film
 Feature
 Musical
 Animation
 Documentary
 Silent
 Short
 Staged
 Performance
 etc.
o TV
 Drama
 Serial
 Documentary
 News
 Current Affairs
 Performance
 Comedy
 Children’s
 Review
 Interview
 etc.
• Photograph

o Sequence
 Scene
 Shot
 Frame
 Object/Actor/Person

9. Formato
Etiqueta: DC.Format
El formato de datos de un recurso, usado para identificar el software y posiblemente, el hardware que se necesitaría para mostrar el recurso. Para asegurar la interoperabilidad, los valores de Format deberían ser seleccionados de entre una lista de valores que actualmente se encuentra bajo desarrollo en un grupo de trabajo.
Format.type = 35mm film, VHS etc.
Format.colour.depth = 256
Format.length = 31 mins.
Format.videocodec = MJPEG, MPEG1, MPEG2, AVI, QT, etc.
Format.framerate = 25
Format.videocolourdepth
Format.videores
Format.videowidth
Format.videoheight
Format.sound = Yes/No
Format.sound.channels
Format.sound.samplerate, etc.

10. Identificador del Recurso
Etiqueta: DC.Identifier
Secuencia de caracteres usados para identificar unívocamente un recurso. Ejemplos para recursos en línea pueden ser URLs y URNs (cuando estén implementados). Para otros recursos pueden ser usados otros formatos de identificadores, como por ejemplo ISBN (“International Standard Book Number” – Número Internacional Normalizado para Libros)
11. Fuente
Etiqueta: DC.Source
Secuencia de caracteres utilizado para identificar unívocamente un trabajo a partir del cual proviene el recurso actual. Por ejemplo, es posible usar Source con la fecha de 1603 como descripción de una película basada en una obra de Shakespeare, pero es preferible, en ese caso, usar Relation “IsBasedOn” con una referencia a un recurso distinto cuya descripción contenga el elemento Date con valor 1603.
12. Lengua
Etiqueta: DC.Language
Lengua/s del contenido intelectual del recurso. Prácticamente el contenido de este campo debería coincidir con los de la RFC 1766 (Tags para la identificación de lenguas, http://ds.internic.net/rfc/rfc1766.txt ); por ejemplo: en, es, de, fi, ja y zh.
13. Relación
Etiqueta: DC.Relation
Un identificador de un segundo recurso y su relación con el recurso actual. Este elemento permite enlazar los recursos relacionados y las descripciones de los recursos. Por ejemplo:
IsVersionOf Incluye la edición de un trabajo
IsBasedOn La traducción de un trabajo
IsPartOf Un capítulo de un libro o una noticia de un informativo
IsFormatOf Un mecanismo de transformación de un conjunto de datos en una imagen
Para asegurar la interoperabilidad, las relaciones deberían ser seleccionadas de una lista de elementos que actualmente se encuentra bajo desarrollo en un grupo de trabajo.
14. Cobertura
Etiqueta: DC.Coverage
La característica de cobertura espacial y/o temporal del contenido intelectual del recurso.
La cobertura espacial se refiere a una región física (por ejemplo, sector celestial); uso de coordenadas (por ejemplo, longitud y latitud) o nombres de lugares extraídos de una lista controlada.
La cobertura temporal se refiere al contenido del recurso en vez de a cuando fue creado o puesto accesible ya que este último pertenece al elemento Date. Se usa el mismo formato basado en http://www.w3.org/TR/NOTE-datetime.
15. Derechos
Etiqueta: DC.Rights
Una referencia (URL, por ejemplo) para una nota sobre derechos de autor, para un servicio de gestión de derechos o para un servicio que dará información sobre términos y condiciones de acceso a un recurso. Una especificación formal del elemento Rights se encuentra actualmente en discusión y por lo tanto su uso se considera experimental.

MPEG-7.

Aunque todavía está en una fase inicial es muy interesante referirse también al MPEG-7, Interfaz de Descripción de contenido multimedia, norma ISO creada por el Moving Pictures Expert Group, creador de normas y formatos de compresión de imagen para tratar el contenido de todo tipo de objeto multimedia. La descripción obtenida estará unida al contenido mismo, para facilitar el acceso al material que sea de interés del usuario.
MPEG-7 sirve para tratar imágenes, gráficos, audio, videos e información sobre cómo estos elementos están combinados en una presentación multimedia. La descripción puede añadirse a cualquier material multimedia, cualquiera que sea el formato de representación. Y aunque la descripción de MPEG-7 no depende de la representación del material, la norma se apoya en cierto sentido sobre la norma MPEG-4 de codificación de materiales audiovisuales.
La descripción normalizada de los diferentes tipos de información puede residir en cierto número de niveles semánticos. Por poner un ejemplo para material visual:
• un nivel de abstracción bajo podría ser la descripción de la forma, tamaño, textura, color y composición
• los niveles más altos darían información semántica como “se trata de una escena con un automóvil rojo a la izquierda y un pájaro volando” codificada de forma eficaz
• Podrían existir también niveles intermedios

Además de la descripción del contenido podrían ser igualmente necesarias informaciones como:
• El formato: Por ejemplo el tipo de compresión utilizado (JPEG) o el tamaño. Esta información ayuda a determinar si el material puede ser leído por el usuario.
• Condiciones de acceso a los materiales. Copyright y precio.
• Enlaces hacia otros materiales interesantes.

Bibliografía y referencias web

Una Filosofia de los Archivos Audiovisuales/ por Ray Edmondson y miembros de la AVAPIN Programa General de Información y UNISIST. – Paris: Organización de las Naciones Unidas para la Educación, la Ciencia y la Cultura, 1998
http://www.unesco.org/webworld/publications/philos/philos.htm
Les Archives télévisuelles à l’heure du numérique. Nº Monographique de Dossiers de l’Audiovisuel. 93, sept.-oct.2000.
Dublin Core Metadata Initiative. http://purl.org/dc/
MPEG-7. Página principal: http://www.darmstadt.gmd.de/mobile/MPEG7/index.html

3 thoughts on “Digitalización del Patrimonio Audiovisual y Análisis Documental

  1. Excelente trabajo, bien estructurado con información y datos muy particularizados. Estoy haciendo mi tesis doctoral sonbre estos temas y este autor y sus investigaciones son formidables.
    gracias
    Sara Martinez

  2. musicóloga y directora de programas de Tv y especialista en conservación de archivo audiovisuales de la televisión cubana , estoy haciendo mi tesis doctoral sobre estos temas y me parece muy bien el trabajo y de gran utilidad
    saludos
    gloria torres

    • Hola Sarah me gustaría intercambiar información con usted sobre este tema, estoy preparando mi tesis doctoral y creo que coincidimos en la elección , soy cubana mi correo lafont@cubarte.cult.cu
      gracias gloria torres

      Sara Martinez :Excelente trabajo, bien estructurado con información y datos muy particularizados. Estoy haciendo mi tesis doctoral sonbre estos temas y este autor y sus investigaciones son formidables.graciasSara Martinez

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s