Una introducción básica al almacenamiento para preservación digital. Parte 3.

¡Hola! Esta es la última entrada de una serie de tres publicaciones. Le sugiero que regrese a las partes 1 y 2 para obtener un poco de contexto. La Parte 1 explica qué es la preservación digital y por qué es importante. La Parte 2 explica qué es el almacenamiento de preservación digital y proporciona información sobre estándares de almacenamiento, lineamientos y mejores prácticas.

shutterstock_1047545539

¿Cuáles son las opciones para la implementación del almacenamiento de preservación digital?

¡Ahora nos estamos metiendo en el meollo del asunto! Esta sección [1] describe algunas de las opciones de infraestructura de almacenamiento para la preservación digital. 

¿Dónde almacenar?

A grandes rasgos, las opciones de almacenamiento se pueden dividir en dos categorías:

  • Almacenamiento administrado localmente o “in-situ”
  • Almacenamiento en la nube o “externalizada”, por ejemplo: Amazon Web Services, Microsoft Azure.
Según los requisitos, la infraestructura técnica y los recursos de una institución, una o ambas opciones pueden ser factibles. Antes de decidirse por una solución u otra, debe realizarse una comparación de las características de cada una, en relación con la necesidad de una gestión a largo plazo de las colecciones digitales.[2]

Las decisiones sobre qué tipo de almacenamiento funcionaría mejor para una institución deben estar influenciadas por los siguientes factores:
  • El nivel de fiabilidad o "tiempo de disponibilidad" requerido. ¿Necesita acceso inmediato a sus masters digitales o puede haber demoras de minutos u horas en recuperarlos?
  • El número y los tipos de usuarios que necesitan acceder a él. ¿Quién se responsabilizará de administrar el contenido digital -- solo los administradores de colecciones digitales, todo el personal de archivos u otra persona? ¿Será también una versión del contenido de acceso público?
  • Tipos y cantidad de contenido digital. ¿Cuánto almacenamiento necesita? ¿A qué ritmo crecerá?
  • Redundancia. ¿Es una institución capaz de administrar de manera segura dos o más copias de su contenido digital localmente, o debe confiar en el almacenamiento en la nube?

Teniendo en cuenta estos problemas junto con las mejores prácticas, como las de los Niveles de Preservación Digital de la NDSA [3], el nivel de esfuerzo requerido, y los recursos disponibles para apoyar la tarea, una institución podrá identificar las mejores opciones de almacenamiento para su situación. Mi sugerencia es que cree un documento, una hoja de cálculo, etc., y reúna a las personas adecuadas en un salón, obtenga algunas respuestas y luego las escriba. Será mucho más fácil llevar sus solicitudes a su administración o benefactores (porque necesitará, ya sabe, dinero para comprar estas cosas) si tiene un equipo con usted y ha documentado sus decisiones.

Medios de almacenamiento

Hay una variedad de opciones de medios de almacenamiento disponibles para el almacenamiento de preservación digital local. Algunos son ampliamente aceptados como apropiados para la preservación, mientras que otros son reconocidos como problemáticos debido a su susceptibilidad al fracaso y la obsolescencia. 

Los medios extraíbles, como los discos duros portátiles, las unidades flash portátiles o los CD y DVD, no se consideran viables como parte de una estrategia general de conservación. Estos medios son altamente susceptibles a fallas por la degradación de los componentes. La realidad es que los archivos a menudo se almacenan o se graban en ellos y luego los medios se archivan o almacenan en cajas y no se controlan activamente. Estos medios también requieren muchos recursos para monitorear los errores; se requiere intervención humana para conectar una unidad flash o reproducir DVD para identificar errores en los archivos almacenados en ellos. 

En cambio, dos medios de almacenamiento predominantes que se consideran buenas alternativas para la gestión de la preservación digital se denominan coloquialmente como "discos giratorios" y "cintas magnéticas". Estas no son las únicas opciones disponibles, pero la información a continuación proporciona cierta idea de las opciones disponibles para la gestión de contenido digital.

Screen Shot 2020-02-04 at 3.38.57 PM

El almacenamiento en disco giratorio, que forma parte de un entorno de almacenamiento en red administrado por TI, se usa comúnmente para el almacenamiento de preservación digital. El almacenamiento en disco giratorio tiene tiempos de respuesta rápidos (baja latencia[4]) y permite que se lleve a cabo un monitoreo activo, como el monitoreo de fijeza. Este tipo de almacenamiento a menudo tiene el costo más alto porque los dispositivos son caros, los servidores siempre están "encendidos" y deben mantenerse en un área segura y ambientalmente controlada, y el personal debe estar disponible para mantener los servidores en funcionamiento y monitorear activamente los datos en ellos.

La cinta de datos magnéticos, más comúnmente "cinta LTO", se usa típicamente para almacenamiento nearline[5] o offline[6]. Los medios de cinta magnética son menos costosos que el disco giratorio u otras opciones de almacenamiento de baja latencia, y el costo de administrarlo con el tiempo se reduce considerablemente, especialmente para el almacenamiento offline. Al igual que otros medios extraíbles, su naturaleza ralentiza el acceso y las actividades de preservación, como el monitoreo activo de la fijeza. Sin embargo, la cinta magnética de datos es mucho más confiable y mucho menos propensa a fallas que las unidades portátiles y los discos ópticos, como CD y DVD. La cinta de datos magnéticos puede almacenarse en bibliotecas de cintas y cargarse en robots de cinta, lo que puede proporcionar cierta automatización para las actividades de acceso y preservación..

Este es el punto clave: los medios que permiten a los administradores de colecciones digitales monitorear activamente el estado de sus colecciones siempre son la mejor opción al decidir las opciones de almacenamiento. Afortunadamente, al momento de publicación, este tipo de almacenamiento también tiende a ser el más frecuente. Sin embargo, no importa qué opción seleccione para el almacenamiento, siempre haga una copia de seguridad de sus datos al menos una vez e idealmente dos veces (tres copias en total) o más.

Resumen

Cada tipo de almacenamiento tiene sus propias implicaciones financieras y organizativas, y cada institución tendrá que sopesar los factores anteriores para encontrar una solución que se adapte mejor a sus necesidades. En algunos casos, no será una decisión entre a y b, sino una solución que utilice ambos tipos de almacenamiento para su mejor efecto en la situación particular de la institución.

Por ejemplo, una institución podría tener políticas de mantener todas las colecciones, ya sean digitales o físicas, in situ. En este caso, pueden optar por una solución de almacenamiento solo local. Es posible que otra institución no tenga la infraestructura y el personal para administrar las colecciones en el sitio, debido a costos o restricciones de personal, y puede optar por el almacenamiento en la nube (Amazon, Microsoft, Google, etc.) o un proveedor como Preservica, Libnova, Exlibris, Arkivum o DuraCloud que ofrece un conjunto de servicios de preservación además del almacenamiento en la nube. Y, como es cada vez más frecuente, una organización podría optar por un enfoque híbrido. En este caso, pueden optar por mantener una única copia en línea en el almacenamiento local para tener acceso rápido a los archivos cuando los necesiten. Las copias secundarias y terciarias se pueden almacenar localmente en el almacenamiento en línea o nearline o en la nube. A menudo, otra copia se almacena en una cinta de datos magnéticos (como LTO) en una ubicación geográfica diferente. Estas copias de seguridad segunda y tercera tienden a ser versiones de archivos a las que no es necesario acceder fácilmente, excepto para el monitoreo periódico de la fijeza. Este enfoque híbrido es una excelente manera de (a) aliviar puntos únicos de falla tecnológica mediante la distribución de contenido a través de soluciones de almacenamiento y (b) distribuir contenido a través de ubicaciones geográficamente diversas.

Un mnemónico fácil para los requisitos básicos de almacenamiento de preservación digital es 3-2-1, lo que significa:

  • Tres copias de sus datos,
  • En dos tipos de medios diferentes,
  • En más de una ubicación geográfica.

¿Próximos pasos?

Ahora es su turno de preparar su organización para responder las siguientes preguntas y estar listos para el almacenamiento para preservación digital. Nuevamente, copie estas preguntas en un documento o formulario, reúna a su equipo (o, si es solo usted, póngase cómodo), discuta ¡y registre sus respuesta!:

  • En su organización, ¿qué constituye un objeto digital que requiere preservación digital a largo plazo?
  • ¿Qué objetos ya tienen formato digital?
  • ¿Almacena múltiples versiones de diferente calidad de un solo objeto digital? Si es así, describa. Por ejemplo: acceso y copias master.
  • ¿Qué tipos de archivos está adquiriendo o creando mediante la digitalización? Por ejemplo: TIF, WAV, MP3.
  • ¿Qué planes tiene para una futura digitalización o adquisición?
  • ¿Cuánto contenido digital (en GB, TB o PB y el número total de archivos) tiene ahora?
  • ¿Cuál es su tasa de crecimiento estimada anualmente? (Piense en un estimado para dar esta respuesta, de ser necesario).
  • ¿En qué servidores u otros medios de almacenamiento se encuentran ahora los objetos digitales? Lístelos todos
  • ¿Cómo está rastreando lo que tiene y dónde está ubicado? Por ejemplo: inventario, base de datos.
  • ¿Con qué frecuencia accede a los objetos digitales originales? Por ejemplo: todo el tiempo, rara vez porque tenemos copias de acceso.
  • ¿Tiene el espacio de servidor para administrar múltiples copias de sus objetos in situ, o tiene sentido aprovechar la flexibilidad que ofrece el almacenamiento en la nube?
  • ¿Tiene el personal para administrar el almacenamiento in situ o la nube es una opción más factible?
  • ¿Existen otros requisitos o restricciones organizacionales que deben considerarse para la selección del almacenamiento digital? Por ejemplo: financiación, aprobación administrativa..
¿No puede esperar? Aquí hay algunas preguntas para prepararse para el almacenamiento de la preservación digital

Una vez respondidas, Usted puede comenzar a tomar decisiones sobre qué almacenamiento le va mejor a su organización. No tema si hoy no tiene muchas opciones de almacenamiento. Recuerde que "lo perfecto es enemigo de lo bueno". Suficientemente bueno = OK por ahora. Si sigues mejorando lo suficientemente bien, incluso de forma incremental, eventualmente estará muy bien y luego increíble. Tal vez nunca llegue a la perfección, pero mientras siga trabajando para eso pronto tendrá una situación de almacenamiento de preservación digital mejor que suficiente.

También consulte el "Capítulo 4: Administración de colecciones audiovisuales digitales" en Fundamentos de la preservación AV, escrito por AVPeeps para la NEDCC.

¿Tiene más preguntas? Contáctenos..


1 Esta sección fue tomada del capítulo de Amy Rudersdorf “Administración de Colecciones Digitales: Sección 3: Infraestructura de Almacenamiento”, parte del libro Fundamentos para la Preservación del NEDCC.

2 Los primeros pasos pueden incluir una revisión de esta tabla de comparación.

3 Hablo sobre los niveles de preservación digital en la Parte 1. ¿Recuerda que dije que esa publicación de blog era un buen lugar para comenzar?

4 La latencia es la medida de la rapidez con que la infraestructura de almacenamiento responde a las solicitudes de acceso a un archivo digital.

5 En este caso, el contenido digital está disponible para los usuarios con cierto tiempo de retraso, que puede ser de unos segundos a un minuto o más.

6 Aquí, el contenido digital se almacena en un medio que requiere que un humano lo conecte a una computadora para acceder a los datos que contiene.