Vitesse d'exécution, en particulier par rapport à Apache Hive. Flexibilité pour fonctionner comme une table RDBMS régulière. Il peut être utilisé pour un grand datamart avec une logique CDC facilement.
Kudu seems to have limited use in Impala. I have tried using is in Spark but didn't have great results (some of that was my fault). Impala isn't really for streaming data where the speed comes in so I'm not sure Kudu fits my use case.
C'est principalement utile pour stocker une grande quantité de données utilisées pour l'analyse de big data. Apache Parquet réduit les opérations d'entrée/sortie, c'est mieux comparé à d'autres outils.
Bien qu'il soit l'un des meilleurs choix pour le traitement par lots, il ne prend pas en charge le stockage de données en temps réel.
Vitesse d'exécution, en particulier par rapport à Apache Hive. Flexibilité pour fonctionner comme une table RDBMS régulière. Il peut être utilisé pour un grand datamart avec une logique CDC facilement.
C'est principalement utile pour stocker une grande quantité de données utilisées pour l'analyse de big data. Apache Parquet réduit les opérations d'entrée/sortie, c'est mieux comparé à d'autres outils.
Kudu seems to have limited use in Impala. I have tried using is in Spark but didn't have great results (some of that was my fault). Impala isn't really for streaming data where the speed comes in so I'm not sure Kudu fits my use case.
Bien qu'il soit l'un des meilleurs choix pour le traitement par lots, il ne prend pas en charge le stockage de données en temps réel.