Meilleures alternatives à Cloudera Data Flow les mieux notées
Avis sur 3 Cloudera Data Flow

Nous exploitons Kafka de Cloudera Data Flow pour l'analyse en continu. CDF nous fournit des données en temps réel, ce qui est essentiel pour produire des tableaux de bord en direct, et la quantité de données en streaming (en pétaoctets) nous aide à avoir CDF comme guichet unique pour l'analyse de données en direct. Avis collecté par et hébergé sur G2.com.
Kafka de CDF bien qu'il soit évolutif, il a cependant beaucoup de problèmes de latence et nécessite un réglage complexe. Lorsque la latence se produit, c'est-à-dire que l'offset actuel est supérieur à l'offset de fin du consommateur, une latence de 6 à 7 chiffres peut être observée, ce qui signifie que les enregistrements obsolètes atteignent parfois environ 1 million, ce qui fait que le tableau de bord attend les dernières données et cela prend parfois des heures pour les récupérer et parfois un redémarrage du service est également nécessaire pour résoudre cela. Avis collecté par et hébergé sur G2.com.

Cloudera Data Flow (CDF) nous offre une plateforme unique pour l'analyse des données de streaming en temps réel. Nous utilisons principalement CFM, CEM pour pousser les données des agents et Kafka pour pousser les données en direct qui sont ensuite consommées par Spark et, après nettoyage, les rapports financiers sont créés. Avis collecté par et hébergé sur G2.com.
Kafka, qui faisait auparavant partie de CDP (Cloudera Data Platform), a été déplacé vers CDF, ce qui nous oblige à acheter un abonnement séparé et donc à entraîner plus de coûts pour le projet. C'était un mouvement intelligent de la part de Cloudera pour gagner plus d'argent, mais cela nous pénalise sûrement car le service que nous utilisions avec CDP doit maintenant être acheté puisqu'il est sous l'égide de CDF. Avis collecté par et hébergé sur G2.com.
Hortonworks two main pillars are HDP (Hortonworks Data Platform) and HDP (Hortonworks Data Flow). The former applies to the infrastructure required for building and deploying a data lake, and the latter is about ingestion, in batch or realtime.
Both HDP and HDF rely entirely on opensource projects, this is a distinctive point about Hortonworks. Avis collecté par et hébergé sur G2.com.
As an open source project collection, it relies strongly on community activity. You still have the option to contract premium consulting or training services.
Altough it is quickly evolving into Data Science tools availability (eg. Tensorflow incorporate in HDP 3), it can be cumbersome from a developer transitioning from a traditional IDE, into the notebook vs. datalake metaphore. Avis collecté par et hébergé sur G2.com.
Il n'y a pas assez d'avis sur Cloudera Data Flow pour que G2 puisse fournir des informations d'achat. Voici quelques alternatives avec plus d'avis :

