La replicación de datos es el proceso de almacenar datos en más de una ubicación para mejorar tanto la disponibilidad como la accesibilidad. Involucra la copia frecuente de datos de una base de datos (u otro almacén de datos) a uno que permite a todos los usuarios compartir el mismo nivel de información. La replicación de datos también puede reducir la carga de trabajo en bases de datos (por ejemplo, transaccionales) donde el rendimiento es clave. El software de replicación de datos facilita este proceso, ofreciendo herramientas para integrar, distribuir, centralizar y sincronizar datos a través de estos diversos almacenes de datos y sistemas. Esto permite a los usuarios gestionar volúmenes de datos crecientes mientras obtienen acceso a información en tiempo real.
En términos de la escala de replicación, puede haber replicación completa, en la cual toda la base de datos se almacena en cada sitio. También puede haber replicación parcial, en la cual algunos fragmentos frecuentemente utilizados de la base de datos se replican y otros no se replican. Las herramientas de replicación de datos también incluyen la capacidad de capturar e identificar cambios realizados en una base de datos, también conocido como captura de datos de cambio (CDC).
El software de replicación de datos proporciona al usuario final una interfaz gráfica en la que pueden gestionar y monitorear centralmente sus datos replicados. Como tal, los equipos de infraestructura—ya sea gestionando servidores, máquinas virtuales, bases de datos u otra infraestructura—pueden usar el software de replicación de datos para mejorar la disponibilidad de los datos y asegurar que sean consistentes.
El software de replicación de datos es similar al software de respaldo de servidores en la medida en que ambos pueden ser utilizados para el almacenamiento de una copia de los datos de la empresa. Sin embargo, el respaldo de servidores es más limitado; su principal caso de uso es para prevenir la pérdida de datos en escenarios de desastre, mientras que la replicación de datos es más amplia y se utiliza para cualquier caso en el que una empresa pueda querer tener copias de datos en diferentes bases de datos, servidores, etc. El software de replicación de datos se utiliza típicamente junto con software de integración de datos, que permite a las empresas extraer datos de varias fuentes y formatos en un solo lugar, y software de procesamiento y distribución de grandes datos, que ofrece una manera de recopilar, distribuir, almacenar y gestionar conjuntos de datos masivos y no estructurados en tiempo real.
Para calificar para la inclusión en la categoría de Replicación de Datos, un producto debe:
Permitir la integración de datos en tiempo real con captura de datos de cambio basada en registros
Replicar datos/infrastructura a través de una amplia gama de bases de datos, almacenes de datos y otras plataformas
Capturar e identificar cambios realizados en una base de datos (CDC)
Proporcionar una interfaz para que los usuarios monitoreen la replicación de datos