Alternativas de Apache Kudu Mejor Valoradas

no es necesario aprender HBase para el procesamiento en tiempo real, Apache Kudu puede ayudarte.
fácil de aprender, eficiente y puedes actualizar los registros.
proporciona Reseña recopilada por y alojada en G2.com.
Primario debe ser la primera columna, a veces es difícil mantener la primera columna como la clave primaria. Reseña recopilada por y alojada en G2.com.
12 de 13 Reseñas totales para Apache Kudu
Sentimiento General de la Reseña para Apache Kudu
Inicia sesión para ver el sentimiento de la revisión.

1. Implementar la Arquitectura Lambda (tanto por lotes como en transmisión en tiempo real) con Kudu es bastante sencillo. Además, utilizamos Streamsets como la plataforma de ingesta, que tiene una buena integración con Kudu.
2. Hace que el análisis en tiempo real sea bastante sencillo. Usamos Kudu para ejecutar múltiples campañas en tiempo real.
3. Hecho a medida para implementar almacenes de datos dentro de un entorno de Big Data.
4. Buena funcionalidad de actualización. Reseña recopilada por y alojada en G2.com.
1. Limitación de Partición: Está limitada a 2000 tabletas/servidor de tabletas.
2. Enfrenta tiempos de espera aleatorios al acercarse a la limitación del número de tabletas (máximo 2000/servidor).
3. Necesita un Esquema Conformado. No hay manejo automático de esquemas cambiantes.
4. Necesita una Clave Primaria para cada tabla.
5. #3 y #4 no son realmente desventajas per se. Reseña recopilada por y alojada en G2.com.

En mi opinión, lo que encontré más útil de Apache Kudu es la posibilidad de realizar agregaciones de datos bastante complejas a través de motores SQL, al mismo tiempo que se pueden realizar actualizaciones de manera eficiente. Reseña recopilada por y alojada en G2.com.
Probablemente dos desventajas de Apache Kudu a tener en cuenta son la configuración de particionamiento, ya que es bastante difícil encontrar la mejor configuración de particionamiento para el rendimiento del caso de uso particular, y también el hecho de que Kudu no equilibra la carga si se añade un nuevo nodo al clúster. Reseña recopilada por y alojada en G2.com.

Es bastante bueno al leer y cargar y es la mejor base de datos columnar sobre Hadoop. Este Kudu viene con Cloudera, por lo que todos los componentes están en un solo lugar. La integración con el script de Impala y la compatibilidad con el formato de archivo Parquet lo hacen más dinámico. Su partición dinámica también ayuda durante la depuración. La integración del metastore de Hive con Kudu también hace que las tablas de Hive y Kudu sean accesibles desde la misma plataforma. Los datos incrementales se replican sin ningún problema para los usuarios finales. Soporta casi todo el SQL ANSI, por lo que resulta muy familiar. Reseña recopilada por y alojada en G2.com.
El particionamiento de Kudu se realiza solo en la clave primaria, lo cual no siempre es adecuado. En algunos casos, tenemos una marca de tiempo como clave de partición, pero no podría ser la clave primaria, por lo que leer una tabla enorme es una preocupación aquí. Esto necesita cambiarse en el futuro. Hay preocupación sobre el contexto de Kudu con la integración de Impala. Actualmente, la conectividad JDBC todavía tiene algunos problemas para grandes volúmenes de datos.
Es un problema con el nombre de la tabla en camel case. Las tablas de Kudu con un nombre de columna que contiene caracteres en mayúsculas o caracteres no ASCII pueden no ser utilizadas como una tabla externa en Impala. Las columnas pueden ser renombradas en Kudu para solucionar este problema. Reseña recopilada por y alojada en G2.com.

Velocidad de ejecución, especialmente en comparación con Apache Hive. Flexibilidad para trabajar como una tabla RDBMS regular. Se puede utilizar para un gran datamart con lógica CDC con facilidad. Reseña recopilada por y alojada en G2.com.
Tienes que decidir la clave primaria para cada uno de los objetos. Así que, más enfoque en el aspecto de Modelado de Datos. Reseña recopilada por y alojada en G2.com.

Fácilmente accesible desde el motor de consultas APACHE Impala, por lo que la experiencia de creación de paneles y OLAP es fluida. Reseña recopilada por y alojada en G2.com.
Con una gran cantidad de datos en streaming, la carga en el sistema aumenta exponencialmente, lo que afecta a otros servicios que se ejecutan en el mismo servidor. Reseña recopilada por y alojada en G2.com.

Características de Integración Kudu-Impala
Uso del Algoritmo de Consenso Raft para garantizar la tolerancia a fallos Reseña recopilada por y alojada en G2.com.
Escalabilidad limitada: datos que puedes tener en Kudu por nodo de clúster y por clúster. Reseña recopilada por y alojada en G2.com.
The best benefit is that you can run analytics on top of Hadoop. You don't need to propose an alternative big data solution to customer to run analytics if they have already selected Hadoop for Big Data storage. Reseña recopilada por y alojada en G2.com.
Kudu has limitations in the type of data it can handle. You can't store complex structured data as you can do with Impala. Reseña recopilada por y alojada en G2.com.
Easy to use
Updation and deletion which is not available in hive tables
Fast insertion deletion all ACID operations Reseña recopilada por y alojada en G2.com.
Documentations are not available specially detailing heavy workloads, optimizations Reseña recopilada por y alojada en G2.com.


Lo más útil es que está completamente distribuido y es tolerante a fallos, lo que facilita nuestra vida. Reseña recopilada por y alojada en G2.com.
Lo único que no me gusta es el uso de claves primarias, las claves primarias autogeneradas no siempre son compatibles. Reseña recopilada por y alojada en G2.com.