La réplication de données est le processus de stockage de données dans plus d'un emplacement pour améliorer à la fois la disponibilité et l'accessibilité. Elle implique la copie fréquente de données d'une base de données (ou autre stockage de données) vers une autre qui permet à tous les utilisateurs de partager le même niveau d'information. La réplication de données peut également réduire la charge de travail sur les bases de données (par exemple, transactionnelles) où la performance est essentielle. Les logiciels de réplication de données facilitent ce processus, offrant des outils pour intégrer, distribuer, centraliser et synchroniser les données à travers ces différents magasins de données et systèmes. Cela permet aux utilisateurs de gérer des volumes de données croissants tout en accédant à des informations en temps réel.
En termes d'échelle de réplication, il peut y avoir une réplication complète, dans laquelle la base de données entière est stockée à chaque site. Il peut également y avoir une réplication partielle, dans laquelle certains fragments fréquemment utilisés de la base de données sont répliqués et d'autres ne le sont pas. Les outils de réplication de données incluent également la capacité de capturer et d'identifier les changements apportés à une base de données, également connue sous le nom de capture de données de changement (CDC).
Les logiciels de réplication de données fournissent à l'utilisateur final une interface graphique dans laquelle ils peuvent gérer et surveiller leurs données répliquées de manière centralisée. Ainsi, les équipes d'infrastructure—qu'elles gèrent des serveurs, des machines virtuelles, des bases de données ou d'autres infrastructures—peuvent utiliser des logiciels de réplication de données pour améliorer la disponibilité des données et s'assurer qu'elles sont cohérentes.
Les logiciels de réplication de données sont similaires aux logiciels de sauvegarde de serveur dans la mesure où ils peuvent tous deux être utilisés pour le stockage d'une copie des données de l'entreprise. Cependant, la sauvegarde de serveur est plus limitée ; son principal cas d'utilisation est de prévenir la perte de données dans des scénarios de catastrophe, tandis que la réplication de données est plus large et est utilisée pour tout cas dans lequel une entreprise pourrait vouloir avoir des copies de données dans différentes bases de données, serveurs, etc. Les logiciels de réplication de données sont généralement utilisés en parallèle avec des logiciels d'intégration de données, qui permettent aux entreprises de rassembler des données de plusieurs sources et formats en un seul endroit, et des logiciels de traitement et de distribution de big data, qui offrent un moyen de collecter, distribuer, stocker et gérer des ensembles de données massifs et non structurés en temps réel.
Pour être inclus dans la catégorie Réplication de Données, un produit doit :
Permettre l'intégration de données en temps réel avec la capture de données de changement basée sur les journaux
Répliquer les données/infrastructures à travers une large gamme de bases de données, entrepôts de données et autres plateformes
Capturer et identifier les changements apportés à une base de données (CDC)
Fournir une interface pour que les utilisateurs surveillent la réplication de données