Alternativas de Cloudera Data Flow Mejor Valoradas
Hortonworks two main pillars are HDP (Hortonworks Data Platform) and HDP (Hortonworks Data Flow). The former applies to the infrastructure required for building and deploying a data lake, and the latter is about ingestion, in batch or realtime.
Both HDP and HDF rely entirely on opensource projects, this is a distinctive point about Hortonworks. Reseña recopilada por y alojada en G2.com.
As an open source project collection, it relies strongly on community activity. You still have the option to contract premium consulting or training services.
Altough it is quickly evolving into Data Science tools availability (eg. Tensorflow incorporate in HDP 3), it can be cumbersome from a developer transitioning from a traditional IDE, into the notebook vs. datalake metaphore. Reseña recopilada por y alojada en G2.com.
2 de 3 Reseñas totales para Cloudera Data Flow

Estamos aprovechando Kafka de Cloudera Data Flow para análisis de transmisión. CDF nos proporciona datos en tiempo real, lo cual es crítico para producir paneles en vivo, y también la cantidad de datos en transmisión (en petabytes) nos ayuda a tener CDF como una solución integral para el análisis de datos en vivo. Reseña recopilada por y alojada en G2.com.
Kafka de CDF, aunque es escalable, tiene muchos problemas de retraso y necesita ajustes complejos. Cuando ocurre el retraso, es decir, cuando el desplazamiento actual es mayor que el desplazamiento final del consumidor, se puede observar un retraso de 6-7 cifras, lo que significa que los registros obsoletos alcanzan alrededor de 1 millón a veces, debido a lo cual el panel de control espera los datos más recientes y a veces toma horas obtenerlos y a veces también se requiere reiniciar el servicio para solucionar eso. Reseña recopilada por y alojada en G2.com.

Cloudera Data Flow (CDF) nos proporciona una plataforma única para el análisis de datos de transmisión en tiempo real. Principalmente usamos CFM, CEM para enviar datos de agentes y Kafka para enviar datos en vivo que luego son consumidos por Spark y, después de la limpieza, se crean los informes financieros. Reseña recopilada por y alojada en G2.com.
Kafka, que anteriormente era parte de CDP (plataforma de datos de Cloudera), se ha trasladado a CDF, lo que nos obliga a comprar una suscripción separada y, por lo tanto, incurrir en más costos para el proyecto. Este fue un movimiento inteligente por parte de Cloudera para ganar más dinero, pero sin duda nos perjudica, ya que el servicio que utilizábamos junto con CDP ahora tiene que comprarse, ya que está bajo el paraguas de CDF. Reseña recopilada por y alojada en G2.com.
No hay suficientes reseñas de Cloudera Data Flow para que G2 proporcione información de compra. A continuación, se muestran algunas alternativas con más reseñas:

