Las bases de datos de columnas amplias son bases de datos NoSQL que almacenan datos en tablas, filas y columnas. El nombre y los formatos de columna pueden variar de una fila a otra. Las bases de datos de columnas amplias generalmente se interpretan como almacenes de clave-valor 2D o clave clave-valor. Las bases de datos de columnas amplias también se conocen como bases de datos de familias de columnas. Estas bases de datos se utilizan para flujos de trabajo transaccionales. Las bases de datos de columnas amplias se pueden utilizar en casos con grandes conjuntos de datos distribuidos en múltiples nodos de base de datos. Dado el gran volumen de datos en IoT, los científicos de datos suelen utilizar bases de datos de columnas amplias para almacenar datos de IoT y perfiles de usuario. También se utiliza para gestionar grandes almacenes de datos debido a su capacidad para escalar.
Las bases de datos de columnas amplias ayudan a la escalabilidad horizontal de los datos y proporcionan consistencia de datos. Los datos se almacenan en celdas de columna que se agrupan en familias de columnas. Las bases de datos de columnas amplias pueden filtrar datos por valor. Las bases de datos de columnas amplias difieren de las bases de datos columnar con respecto al almacenamiento de datos. Las bases de datos columnar almacenan cada columna por separado en un disco, mientras que las bases de datos de columnas amplias admiten familias de columnas almacenadas juntas. Las bases de datos de columnas amplias también difieren de las bases de datos relacionales. Las bases de datos relacionales tienen múltiples tablas, mientras que las bases de datos de columnas amplias tienen múltiples familias de columnas.