Principais Alternativas de Apache Kudu Mais Bem Avaliadas
Avaliações 13 Apache Kudu
Sentimento Geral da Revisão para Apache Kudu
Entre para ver o sentimento das avaliações.

1. Implementar a Arquitetura Lambda (tanto em Lote quanto em Streaming em Tempo Real) com Kudu é bastante direto. Além disso, usamos o Streamsets como a Plataforma de Ingestão, que tem um bom acoplamento com o Kudu.
2. Torna a Análise em Tempo Real bastante direta. Usamos o Kudu para executar várias Campanhas em Tempo Real.
3. Feito sob medida para Implementar Armazéns de Dados dentro de um Ambiente de Big Data.
4. Boa Funcionalidade de Upsert. Análise coletada por e hospedada no G2.com.
1. Limitação de Partição - É limitada a 2000 tablets/servidor de tablet.
2. Enfrenta Timeouts Aleatórios ao se aproximar da limitação do número de tablets (máximo de 2000/servidor).
3. Necessita de um Esquema Conformado. Não há manuseio automático de esquemas flutuantes.
4. Necessita de uma Chave Primária para cada tabela.
5. #3 e #4 não são realmente desvantagens por si só. Análise coletada por e hospedada no G2.com.

Na minha opinião, o que achei mais útil sobre o Apache Kudu é a possibilidade de fazer agregações de dados bastante complexas através de mecanismos SQL, enquanto também é possível realizar atualizações de forma eficiente. Análise coletada por e hospedada no G2.com.
Provavelmente, duas desvantagens do Apache Kudu a serem consideradas são a configuração de particionamento, pois é bastante difícil encontrar a melhor configuração de particionamento para o desempenho de um caso de uso específico, e também o fato de que o Kudu não equilibra a carga se um novo nó for adicionado ao cluster. Análise coletada por e hospedada no G2.com.

É bastante bom ao ler e carregar e é o melhor banco de dados colunar em cima do Hadoop. Este Kudu vem com Cloudera, então todos os componentes estão em um só lugar. A integração com o script Impala e a compatibilidade com o formato de arquivo Parquet o tornam mais dinâmico. Sua partição dinâmica também ajuda durante a depuração. A integração do Kudu com o metastore do Hive também torna as tabelas do Hive e do Kudu acessíveis a partir da mesma plataforma. Os dados incrementais são replicados sem qualquer problema para os usuários finais. Ele suporta quase todo o SQL ANSI, então parece muito familiar. Análise coletada por e hospedada no G2.com.
O particionamento do Kudu é feito apenas na chave primária, o que nem sempre é adequado. Em alguns casos, temos o carimbo de data/hora como chave de partição, mas que não pode ser a chave primária, então a leitura de uma tabela enorme é uma preocupação aqui. Portanto, isso precisa ser alterado no futuro. Há preocupação com a integração do Kudu Context com o Impala. Atualmente, a conectividade JDBC ainda apresenta alguns problemas para grandes volumes de dados.
É um problema de nome de tabela em camel case. Tabelas Kudu com um nome de coluna contendo caracteres maiúsculos ou não ASCII podem não ser usadas como uma tabela externa no Impala. As colunas podem ser renomeadas no Kudu para contornar esse problema. Análise coletada por e hospedada no G2.com.

Velocidade de execução, especialmente em comparação com o Apache Hive. Flexibilidade para funcionar como uma tabela RDBMS regular. Pode ser usado para um grande datamart com lógica CDC com facilidade. Análise coletada por e hospedada no G2.com.
Você tem que decidir a chave primária para cada objeto. Então, mais foco no aspecto de Modelagem de Dados. Análise coletada por e hospedada no G2.com.

Facilmente acessível a partir do mecanismo de consulta APACHE Impala, portanto, a construção de painéis e a experiência OLAP são contínuas. Análise coletada por e hospedada no G2.com.
Com um grande número de dados de streaming, a carga no sistema aumenta exponencialmente, afetando outros serviços em execução no mesmo servidor. Análise coletada por e hospedada no G2.com.

Recursos de Integração Kudu-Impala
Algoritmo de Consenso Raft usado para garantir tolerância a falhas Análise coletada por e hospedada no G2.com.
Escalabilidade Limitada: dados que você pode ter no Kudu por nó de cluster e por cluster Análise coletada por e hospedada no G2.com.
The best benefit is that you can run analytics on top of Hadoop. You don't need to propose an alternative big data solution to customer to run analytics if they have already selected Hadoop for Big Data storage. Análise coletada por e hospedada no G2.com.
Kudu has limitations in the type of data it can handle. You can't store complex structured data as you can do with Impala. Análise coletada por e hospedada no G2.com.
Easy to use
Updation and deletion which is not available in hive tables
Fast insertion deletion all ACID operations Análise coletada por e hospedada no G2.com.
Documentations are not available specially detailing heavy workloads, optimizations Análise coletada por e hospedada no G2.com.

não é necessário aprender HBase para processamento em tempo real, o Apache Kudu pode ajudar você. fácil de aprender, eficiente e você pode atualizar os registros. ele fornece Análise coletada por e hospedada no G2.com.
Primário deve ser a primeira coluna, algumas vezes é difícil manter a 1ª coluna como a chave primária. Análise coletada por e hospedada no G2.com.
