A replicação de dados é o processo de armazenar dados em mais de um local para melhorar tanto a disponibilidade quanto a acessibilidade. Envolve a cópia frequente de dados de um banco de dados (ou outro armazenamento de dados) para um que permita a todos os usuários compartilhar o mesmo nível de informação. A replicação de dados também pode reduzir a carga de trabalho em bancos de dados (por exemplo, transacionais) onde o desempenho é fundamental. O software de replicação de dados facilita esse processo, oferecendo ferramentas para integrar, distribuir, centralizar e sincronizar dados entre esses diversos armazenamentos de dados e sistemas. Isso permite que os usuários gerenciem volumes crescentes de dados enquanto obtêm acesso a informações em tempo real.
Em termos de escala de replicação, pode haver replicação completa, na qual todo o banco de dados é armazenado em cada local. Também pode haver replicação parcial, na qual alguns fragmentos frequentemente usados do banco de dados são replicados e outros não. As ferramentas de replicação de dados também incluem a capacidade de capturar e identificar alterações feitas em um banco de dados, também conhecidas como captura de dados de alteração (CDC).
O software de replicação de dados fornece ao usuário final uma interface gráfica na qual ele pode gerenciar e monitorar centralmente seus dados replicados. Assim, as equipes de infraestrutura—seja gerenciando servidores, máquinas virtuais, bancos de dados ou outra infraestrutura—podem usar o software de replicação de dados para melhorar a disponibilidade dos dados e garantir que eles sejam consistentes.
O software de replicação de dados é semelhante ao software de backup de servidor na medida em que ambos podem ser usados para o armazenamento de uma cópia dos dados da empresa. No entanto, o backup de servidor é mais limitado; seu principal caso de uso é para prevenir a perda de dados em cenários de desastre, enquanto a replicação de dados é mais ampla e é usada para qualquer caso em que uma empresa possa querer ter cópias de dados em diferentes bancos de dados, servidores, etc. O software de replicação de dados é tipicamente usado juntamente com software de integração de dados, que permite que as empresas extraiam dados de várias fontes e formatos em um só lugar, e software de processamento e distribuição de big data, que oferece uma maneira de coletar, distribuir, armazenar e gerenciar conjuntos de dados massivos e não estruturados em tempo real.
Para se qualificar para inclusão na categoria de Replicação de Dados, um produto deve:
Permitir a integração de dados em tempo real com captura de dados de alteração baseada em log
Replicar dados/infrastrutura em uma ampla gama de bancos de dados, data warehouses e outras plataformas
Capturar e identificar alterações feitas em um banco de dados (CDC)
Fornecer uma interface para os usuários monitorarem a replicação de dados