Definition

Copia de seguridad o respaldo

La copia de seguridad, también llamada respaldo o backup, se refiere a la copia de archivos físicos o virtuales o bases de datos a un sitio secundario para su preservación en caso de falla del equipo u otra catástrofe. El proceso de copia de seguridad de los datos es fundamental para un plan de recuperación de desastres (DRP) exitoso.

¿Qué son el respaldo y la recuperación?

Las empresas hacen una copia de seguridad (respaldo) de los datos que consideran vulnerables en caso de software defectuoso, corrupción de datos, falla de hardware, piratería maliciosa (hacking), error de usuario u otros eventos imprevistos. Las copias de seguridad capturan y sincronizan una instantánea de un punto en el tiempo que luego se usa para devolver los datos a su estado anterior.

Las pruebas de copia de seguridad y recuperación examinan las prácticas y tecnologías de una organización para la seguridad y la replicación de datos. El objetivo es garantizar una recuperación de datos rápida y confiable en caso de que surja la necesidad. El proceso de recuperación de archivos de datos respaldados se conoce como restauración de archivos.

Los términos copia de seguridad de datos y protección de datos a menudo se usan indistintamente, aunque la protección de datos abarca los objetivos más amplios de continuidad empresarial, seguridad de datos, administración del ciclo de vida de la información y prevención de malware y virus informáticos.

¿Qué datos se deben respaldar y con qué frecuencia?

Un proceso de copia de seguridad se aplica a las bases de datos críticas o aplicaciones de línea de negocio relacionadas. El proceso se rige por políticas predefinidas de respaldo que especifican la frecuencia con la que se realiza la copia de seguridad de los datos y la cantidad de copias duplicadas (conocidas como réplicas), así como los acuerdos de nivel de servicio (SLA) que estipulan la rapidez con la que se deben restaurar los datos.

Las mejores prácticas sugieren que se debe programar una copia de seguridad completa de los datos al menos una vez a la semana, a menudo durante los fines de semana o fuera del horario laboral. Para complementar las copias de seguridad completas semanales, las empresas generalmente programan una serie de tareas de respaldo de datos incrementales o diferenciales que solo realizan copias de los datos que han cambiado desde la última copia de seguridad completa.

Medios de almacenamiento de copia de seguridad

Las empresas suelen realizar respaldo de datos clave en dispositivos de copia de seguridad dedicados o sistemas de cinta magnéticos. Los sistemas de deduplicación de datos contienen unidades de disco duro (HDD) y están equipados con software para establecer políticas de respaldo.

Los sistemas de copia de seguridad de disco a disco aparecieron inicialmente como una alternativa a las bibliotecas de unidades de cinta de copia de seguridad magnética. Tanto el disco como la cinta todavía se usan hoy, y con frecuencia en conjunto.

A medida que aumentan los tamaños de los archivos, algunos proveedores de sistemas de respaldo han lanzado al mercado dispositivos de protección de datos integrados para simplificar el proceso de copia de seguridad. Un dispositivo de datos integrado es esencialmente un servidor de archivos equipado con HDD y software de respaldo desarrollado por el proveedor. Estos dispositivos de almacenamiento de datos plug-and-play a menudo incluyen funciones automatizadas para monitorear la capacidad del disco, el almacenamiento expandible y las bibliotecas de cintas preconfiguradas.

La mayoría de los dispositivos de respaldo basados en disco permiten que las copias se muevan de medios giratorios a cintas magnéticas para una retención a largo plazo. Los sistemas de cinta magnética todavía se utilizan como medios de respaldo debido al aumento de las densidades de cinta y al aumento de los sistemas de archivo de cinta lineal.

Una biblioteca de cintas virtuales (VTL) proporciona una opción menos costosa para una matriz de deduplicación. Una VTL es un sistema basado en disco cuyo comportamiento imita al de una biblioteca de cintas físicas.

Las unidades de estado sólido (SSD) generalmente no se utilizan para la copia de seguridad de datos debido a problemas de tecnología de la red. Algunos proveedores de almacenamiento incluyen SSD como una herramienta de almacenamiento en caché o de niveles para administrar escrituras con arrays basados en disco. Los datos se almacenan inicialmente en caché en el almacenamiento flash y luego se escriben en el disco.

Copia de seguridad local vs. respaldo sin conexión para el almacenamiento primario

Los sistemas de almacenamiento primario modernos han evolucionado para ofrecer capacidades nativas más sólidas para el respaldo de datos. Estas características incluyen esquemas avanzados de protección RAID, instantáneas ilimitadas y herramientas para replicar instantáneas en una copia de seguridad secundaria o incluso en una copia de seguridad terciaria externa. A pesar de estos avances, el respaldo basado en el almacenamiento primario tiende a ser más costoso y carece de las capacidades de indexación que se encuentran en los productos de copia de seguridad tradicionales. La deduplicación de datos, por ejemplo, apareció por primera vez en los dispositivos de respaldo de EMC Data Domain, pero gradualmente se está convirtiendo en una característica de referencia de los arreglos de almacenamiento primario de marca.

Los respaldos locales colocan copias de datos en discos duros externos o sistemas de cinta magnética, que generalmente se encuentran en o cerca de un centro de datos local. Los datos se transmiten a través de una conexión de red segura de banda ancha o de una intranet corporativa.

Una de las ventajas de la copia de seguridad local es la capacidad de realizar una copia de seguridad de los datos detrás de un firewall de red. La copia de seguridad local también es mucho más rápida y proporciona un mayor control sobre quién puede acceder a los datos.

La copia de seguridad sin conexión o en frío es similar al respaldo local, aunque a menudo se asocia con la copia de seguridad de una base de datos. Un respaldo fuera de línea incurre en tiempo de inactividad desde que se realiza el proceso de copia de seguridad mientras la base de datos está desconectada de su red.

Respaldo y almacenamiento en la nube

A la inversa, la copia de seguridad fuera del sitio transmite copias de datos a una ubicación remota, que puede incluir el centro de datos secundario de una empresa o la instalación de colocación arrendada. Cada vez más, la copia de seguridad de datos fuera del sitio equivale al almacenamiento en la nube basado en suscripción como un servicio, que proporciona una capacidad escalable y de bajo costo y elimina la necesidad del cliente de comprar y mantener hardware de respaldo. A pesar de su creciente popularidad, la elección de la copia de seguridad como un servicio requiere que los usuarios cifren los datos y tomen otras medidas para salvaguardar la integridad de los datos.

El respaldo en la nube se divide en lo siguiente:

  • Almacenamiento público en la nube: los usuarios envían datos a un proveedor de servicios en la nube, que les cobra una tarifa de suscripción mensual basada en el almacenamiento consumido. Hay tarifas adicionales por ingreso y egreso de datos. Amazon Web Services (AWS), Google Compute Engine y Microsoft Azure son actualmente los mayores proveedores de nube pública.
  • Almacenamiento en la nube privada: se realiza un respaldo de los datos en diferentes servidores dentro del firewall de la compañía, generalmente entre un centro de datos local y un sitio de recuperación de desastres secundario. Por esta razón, el almacenamiento en la nube privada a veces se denomina almacenamiento interno en la nube.
  • Almacenamiento híbrido en la nube: una empresa usa almacenamiento local y externo. Las empresas suelen utilizar el almacenamiento en la nube pública de forma selectiva para el archivo de datos y la retención a largo plazo. Utilizan el almacenamiento privado para el acceso local y la copia de seguridad para un acceso más rápido a sus datos más críticos.

La mayoría de los proveedores de copias de seguridad permiten respaldar las aplicaciones locales en una nube privada dedicada, tratando de manera efectiva la copia de seguridad de datos basada en la nube como una extensión del centro de datos físico del cliente. También conocido como recuperación de desastres como un servicio (DRaaS), este campo de maduración permite a una organización arrendar espacio en los servidores de almacenamiento de un proveedor de servicios para la copia de seguridad centralizada y la gestión de datos de la línea de vida.

La copia de seguridad de datos de nube a nube es un enfoque alternativo que ha ido ganando impulso. Con este método, los datos de un cliente se copian de una plataforma de copia de seguridad en la nube a otra nube. También se refiere a las copias de seguridad basadas en la nube de datos almacenados en plataformas de software como servicio (SaaS).

Almacenamiento de respaldo para PCs y dispositivos móviles

Los usuarios de PCs pueden considerar tanto la copia de seguridad local desde el disco duro interno de la computadora a un disco duro externo conectado o los medios extraíbles, como una unidad de disco USB. Otra alternativa para los consumidores es respaldar los datos en teléfonos inteligentes y tabletas para el almacenamiento en la nube personal, que están disponibles en proveedores como Box, Carbonite, Dropbox, Google Drive, Microsoft OneDrive y otros. Estos servicios se utilizan comúnmente para proporcionar una cierta capacidad gratuita, dando a los consumidores la opción de comprar almacenamiento adicional según sea necesario. A diferencia del almacenamiento empresarial en la nube, como un servicio, estas ofertas de nube basadas en el consumidor generalmente no proporcionan el nivel de seguridad de datos que requieren las empresas.

Proveedores de software y hardware de respaldo

Los proveedores que venden plataformas de hardware de respaldo incluyen a Barracuda Networks, Dell, Drobo, EMC (Data Domain), ExaGrid Systems, Hewlett Packard Enterprise (HPE), Hitachi Vantara (incluido Sepaton), IBM, NEC Corp., NetApp, Oracle Storage Tek (bibliotecas de cintas), Quantum Corp., Spectra Logic, Unitrends y Veritas NetBackup (anteriormente Symantec NetBackup).

Entre los principales proveedores de software de copia de seguridad empresarial se incluyen Acronis, Arcserve, Asigra, Commvault, Datto, Druva, EMC Data Protection Suite (Avamar, Data Protection Advisor, Mozy, NetWorker y SourceOne), el gestor de replicación de EMC RecoverPoint, Nakivo y Veeam Software.

El sistema operativo Microsoft Windows Server presenta de forma inherente el Sistema de archivos resiliente de Microsoft (Microsoft ReFS) para detectar y reparar automáticamente los datos dañados. Aunque no es técnicamente una copia de seguridad de datos, Microsoft ReFS está diseñado para ser una medida preventiva para proteger los datos del sistema de archivos contra la corrupción.

VMware vSphere proporciona un conjunto de herramientas de respaldo para protección de datos, alta disponibilidad y replicación. Las APIs de VMware vStorage para protección de datos (VADP) permiten a VMware o al software de respaldo de terceros compatible realizar copias de seguridad completas e incrementales de máquinas virtuales (VMs). VADP implementa copias de seguridad a través de instantáneas basadas en hipervisor. Como complemento de la copia de seguridad de datos, la migración en vivo de VMware vSphere permite que las VMs se muevan entre diferentes plataformas para minimizar el impacto de un evento de recuperación de desastres (DR). VMware Virtual Volumes también figura para ayudar a la copia de seguridad de VMs.

Robots de respaldo

Un robot de respaldo es un dispositivo de almacenamiento externo USB 2.0 automatizado que admite múltiples discos duros Serial ATA extraíbles. La primera instancia de un robot de copia de seguridad digital fue introducida por Drobo, y luego operó como Data Robotics. En lugar de utilizar un brazo robótico para manipular el hardware, el robot de respaldo formatea y distribuye automáticamente los datos entre los diversos discos duros que se encuentran dentro de él, utilizando la tecnología de virtualización de almacenamiento para respaldar cada uno de los discos en los otros discos.

Robot de respaldo de Drobo

Las características del software han reemplazado en gran medida la robótica mecánica en los sistemas de copia de seguridad y archivo de cinta.

Tipos de copia de seguridad definidos

La copia de seguridad completa captura una copia de un conjunto de datos completo. Aunque se considera el método de copia de seguridad más confiable, realizar un respaldo completo requiere mucho tiempo y requiere una gran cantidad de discos y/o cintas. La mayoría de las organizaciones ejecutan copias de seguridad completas solo periódicamente.

La copia de seguridad incremental ofrece una alternativa al respaldo completo al hacer una copia de seguridad de los datos que han cambiado desde la última copia completa. El inconveniente es que una restauración completa toma más tiempo si se utiliza una copia de respaldo de datos basada en incrementos para la recuperación.

La copia de seguridad diferencial copia datos cambiados desde la última copia de seguridad completa. Esto permite que una restauración completa ocurra más rápidamente al requerir solo la última copia de seguridad completa y la última copia de seguridad diferencial. Por ejemplo, si crea un respaldo completo el lunes, el respaldo del martes, en ese momento, sería similar a una copia de seguridad incremental. El respaldo del miércoles luego haría una copia de seguridad del diferencial que ha cambiado desde la copia de seguridad completa del lunes. El inconveniente es que el crecimiento progresivo de las copias de seguridad diferenciales tiende a afectar negativamente su ventana de respaldos. Una copia de seguridad diferencial genera un archivo al combinar una copia completa anterior con una o más copias incrementales creadas posteriormente. El archivo ensamblado no es una copia directa de ningún archivo actual o creado anteriormente, sino que se sintetiza a partir del archivo original y cualquier modificación posterior de ese archivo.

La copia de seguridad completa sintética es una variación de la copia de seguridad diferencial. En una copia de seguridad completa sintética, el servidor de respaldos produce una copia completa adicional, que se basa en el respaldo completo original y en los datos obtenidos de copias incrementales.

Las copias de seguridad incrementales continuas minimizan la ventana de copia de seguridad al tiempo que proporcionan un acceso más rápido a la recuperación de datos. Un respaldo incremental continuo captura el conjunto de datos completo y luego lo complementa con copias de seguridad incrementales a partir de ese momento. El respaldo de bloques modificados también se conoce como diferenciación delta. Las copias completas de los conjuntos de datos normalmente se almacenan en el servidor de copia de seguridad, lo que automatiza la restauración.

Las copias de seguridad incrementales inversas son cambios realizados entre dos instancias de un espejo. Una vez que se realiza un respaldo completo inicial, cada copia de seguridad incremental sucesiva aplica cualquier cambio a la copia completa existente. Básicamente, esto genera una nueva copia de seguridad completa sintética cada vez que se aplica un cambio incremental, al mismo tiempo que proporciona una reversión a los respaldos completos anteriores.

La copia de seguridad en caliente, también conocida como copia de seguridad dinámica, se aplica a los datos que permanecen disponibles para los usuarios a medida que la actualización está en proceso. Este método evita el tiempo de inactividad del usuario y la pérdida de productividad. El riesgo con la copia de seguridad activa es que, si los datos se modifican mientras el respaldo está en curso, la copia resultante puede no coincidir con el estado final de los datos.

Técnicas y tecnologías para complementar el respaldo de datos

La protección continua de datos (CDP) se refiere a capas de tecnologías asociadas diseñadas para mejorar la protección de datos. Un sistema de almacenamiento basado en CDP realiza un respaldo de todos los datos de la empresa cada vez que se realiza un cambio. Las herramientas CDP permiten crear múltiples copias de datos. Muchos sistemas de protección continua de datos contienen un motor incorporado que replica datos de un servidor de respaldo primario a uno secundario y/o almacenamiento basado en cinta. La copia de seguridad de disco a disco a cinta es una arquitectura popular para los sistemas CDP.

El sistema CDP casi continuo toma instantáneas de respaldo a intervalos establecidos, que son diferentes de las instantáneas de proveedores basados en matrices que se toman cada vez que se escriben nuevos datos en el almacenamiento.

La reducción de datos disminuye su huella de almacenamiento. Existen dos métodos principales: compresión de datos y deduplicación de datos. Estos métodos se pueden utilizar individualmente, pero los proveedores a menudo combinan los enfoques. Reducir el tamaño de los datos tiene implicaciones en las ventanas de copia de seguridad y los tiempos de restauración.

La clonación de discos implica copiar el contenido del disco duro de una computadora, guardarlo como un archivo de imagen y transferirlo a los medios de almacenamiento. La clonación de discos se puede usar para el aprovisionamiento, aprovisionamiento del sistema, recuperación del sistema y reinicio o retorno de un sistema a su configuración original.

El código de borrado, también conocido como corrección de errores directa, evolucionó como una alternativa escalable a los sistemas RAID tradicionales. La codificación de borrado más a menudo se asocia con el almacenamiento de objetos. RAID distribuye las escrituras de datos en varias unidades, utilizando una unidad de paridad para garantizar la redundancia y la capacidad de recuperación (resiliencia). La tecnología divide los datos en fragmentos y los codifica con otros bits de datos redundantes. Estos fragmentos codificados se almacenan en diferentes medios de almacenamiento, ubicaciones geográficas o nodos. Los fragmentos asociados se utilizan para reconstruir datos corruptos, utilizando una técnica conocida como sobre-muestreo (oversampling).

La copia de seguridad plana es un esquema de protección de datos en el que una copia directa de una instantánea se traslada al almacenamiento de bajo costo sin el uso del software de respaldo tradicional. La instantánea original conserva su formato y ubicación nativos; la réplica de respaldo plana se monta, en caso de que el original no esté disponible o sea inutilizable.

La duplicación, espejeo o mirroring, coloca los archivos de datos en más de un servidor de cómputo para garantizar que permanezca accesible a los usuarios. En la duplicación síncrona, los datos se escriben en el disco local y remoto simultáneamente. Las escrituras desde el almacenamiento local no se reconocen hasta que se envía una confirmación desde el almacenamiento remoto, lo que garantiza que los dos sitios tengan una copia de datos idéntica. A la inversa, se considera que las escrituras locales asíncronas están completas antes de que se envíe la confirmación desde el servidor remoto.

La replicación permite a los usuarios seleccionar el número requerido de réplicas o copias de los datos necesarios para mantener o reanudar las operaciones comerciales. La replicación de datos copia los datos de una ubicación a otra, proporcionando una copia actualizada para acelerar la recuperación de desastres.

La recuperación en el lugar, o la recuperación instantánea, permite a los usuarios ejecutar temporalmente una aplicación de producción directamente desde una instancia de máquina virtual (VM) de copia de seguridad, manteniendo así la disponibilidad de datos mientras se restaura la VM principal. El montaje de una instancia física o de máquina virtual directamente en un servidor de respaldo o de medios puede acelerar la recuperación a nivel de sistema en minutos. La recuperación de una imagen montada produce un rendimiento degradado, ya que los servidores de respaldo no están dimensionados para las cargas de trabajo de producción.

Las instantáneas de almacenamiento capturan un conjunto de marcadores de referencia en el disco para una base de datos, archivo o volumen de almacenamiento determinado. Los usuarios se refieren a los marcadores, o punteros, para restaurar datos desde un punto seleccionado en el tiempo. Debido a que se deriva de un volumen de origen subyacente, una instantánea de almacenamiento individual es una instancia, no una copia de seguridad completa. Como tal, las instantáneas no protegen los datos contra fallas de hardware.

Las instantáneas generalmente se agrupan en tres categorías: bloque modificado, clones y CDP. Las instantáneas aparecieron por primera vez como una herramienta de administración dentro de una matriz de almacenamiento. El advenimiento de la virtualización agregó instantáneas basadas en hipervisor. Las instantáneas también pueden implementarse mediante un software de respaldo o incluso a través de una máquina virtual.

Gestión de la copia de datos, sincronización de archivos y compartir

Tangencialmente relacionado con la copia de seguridad está la gestión de copias de datos (CDM). Este es un software que proporciona información sobre las múltiples copias de datos que una empresa puede crear. Permite que grupos discretos de usuarios trabajen desde una copia de datos común. Aunque técnicamente no es una tecnología de respaldo, CDM permite a las empresas administrar de manera eficiente las copias de datos mediante la identificación de copias superfluas o subutilizadas, lo que reduce la capacidad de almacenamiento de respaldo y las ventanas de respaldo.

Las herramientas de sincronización y uso compartido de archivos protegen los datos en dispositivos móviles utilizados por los empleados. Estas herramientas básicamente copian archivos de usuario modificados entre dispositivos móviles. Si bien esto protege los archivos de datos, no permite a los usuarios retroceder a un punto en el tiempo en caso de que falle el dispositivo.

Copia de seguridad de datos: variaciones sobre un tema

Al decidir qué tipo de copia de seguridad usar, debe tomar en cuenta varias consideraciones clave. No es raro que una empresa mezcle varios enfoques de respaldo de datos, según lo dictado por la primacía de los datos. Su estrategia de copia de seguridad debe regirse por los acuerdos de niveles de servicio (SLA) que se aplican a una aplicación, con respecto al acceso/disponibilidad de datos, los objetivos de tiempo de recuperación (RTO) y los objetivos de punto de recuperación (RPO). Su elección de copias de seguridad también estará influenciada por la versatilidad de su aplicación de respaldo.

Este contenido se actualizó por última vez en septiembre 2018

Investigue más sobre Almacenamiento flash y en drives