Principais Alternativas de Apache Parquet Mais Bem Avaliadas
I am impressed at how well-designed the file format is. Best for big data/data analysis. Análise coletada por e hospedada no G2.com.
It's a high learning curve. You have to think about the benefits versus the drawbacks Análise coletada por e hospedada no G2.com.
26 de 27 Avaliações Totais para Apache Parquet
Sentimento Geral da Revisão para Apache Parquet
Entre para ver o sentimento das avaliações.

O Apache Parquet provou ser uma ferramenta inestimável na minha caixa de ferramentas de análise de dados. Seu armazenamento colunar eficiente, compatibilidade entre plataformas, suporte à evolução de esquemas e recursos de otimização de desempenho melhoraram significativamente minhas tarefas de processamento de dados. Isso não apenas aumentou minha produtividade, mas também reduziu os custos de infraestrutura. Recomendo altamente o Apache Parquet a qualquer pessoa que lide com grandes conjuntos de dados e busque uma solução de armazenamento robusta e orientada para o desempenho. O Apache Parquet tornou-se uma parte essencial do meu kit de ferramentas de análise de dados, e estou ansioso por inovação e desenvolvimento contínuos neste fantástico projeto de código aberto. Parabéns à equipe de desenvolvimento do Parquet por criar um formato de armazenamento de dados tão poderoso e fácil de usar! Análise coletada por e hospedada no G2.com.
Embora o Parquet suporte a evolução de esquemas, isso adiciona alguma complexidade ao processo, especialmente ao lidar com mudanças complexas de esquemas. A evolução de esquemas pode exigir planejamento e gerenciamento cuidadosos para garantir a consistência dos dados e a compatibilidade das consultas. Análise coletada por e hospedada no G2.com.

A compatibilidade é o melhor sobre o Apache Parquet, ele é projetado para a compatibilidade dentro de uma ampla gama de processamento de dados dos frameworks e ferramentas como Apache Spark, Apache Hive e Apache Impala e outras ferramentas que ajudam a torná-lo uma das melhores escolhas. Análise coletada por e hospedada no G2.com.
Embora seja uma das melhores opções para processamento em lote, não oferece suporte para armazenamento de dados em tempo real. Análise coletada por e hospedada no G2.com.
A melhor coisa sobre o Apache Parquet é que ele está resolvendo os requisitos de armazenamento de forma muito eficiente. Pelo que tenho experiência, ele reduz a necessidade de armazenamento em um terço do armazenamento de dados. E o suporte base do formato parquet pode substituir o hadoop no futuro. Análise coletada por e hospedada no G2.com.
Por enquanto, não encontro especificamente nada como desvantagem, pois acabei de começar a explorar isso agora. Mas talvez no futuro eu possa ter algumas sugestões sobre alguns recursos disso. Análise coletada por e hospedada no G2.com.

Ajuda a armazenar em formato colunar e ter evolução de esquema. Ajuda a converter dados entre os formatos avro e parquet. Esses arquivos podem ser lidos e escritos por muitas linguagens de programação. Análise coletada por e hospedada no G2.com.
Para ser muito franco, não é compatível lidar com uma pequena escala de dados. Estou enfrentando problemas para codificar e decodificar os dados, o que afeta meu desempenho. Também tem suporte limitado para tipos de dados complexos. Análise coletada por e hospedada no G2.com.

Ele armazena dados em armazenamento colunar, que é altamente eficiente para consultas analíticas e também suporta algoritmos de compressão. Também possui compatibilidade entre plataformas, o que facilita a integração em pipelines de processamento de dados existentes. Análise coletada por e hospedada no G2.com.
O desempenho de escrita pode ser melhorado, e leva algum tempo para aprendê-lo. Análise coletada por e hospedada no G2.com.

Uma das principais forças do Parquet é sua compatibilidade com várias estruturas de processamento de dados, incluindo Apache Hive, Apache Spark e Apache Drill. Análise coletada por e hospedada no G2.com.
No entanto, há algumas considerações a ter em mente ao usar o Apache Parquet. Embora ele se destaque em desempenho para cargas de trabalho com muitas leituras, a gravação de dados em arquivos Parquet pode ser mais lenta em comparação com outros formatos como o Apache ORC. Análise coletada por e hospedada no G2.com.

É principalmente útil para armazenar uma grande quantidade de dados que é usada para análises de big data.
Apache Parquet reduz as operações de IO, é melhor em comparação com outras ferramentas. Análise coletada por e hospedada no G2.com.
Mais complexo de configurar e manter em comparação com bancos de dados relacionais como o MySQL. Análise coletada por e hospedada no G2.com.

a compressão é a melhor característica do apache parquet, pois oferece várias técnicas de compressão para reduzir o espaço de armazenamento e melhorar o desempenho de leitura. também suporta múltiplos algoritmos de compressão Análise coletada por e hospedada no G2.com.
Não suporta ingestão de dados em tempo real, mas é uma escolha perfeita para processamento de dados em lote. Análise coletada por e hospedada no G2.com.
Bens para armazenar qualquer tipo de dados massivos, incluindo textos, filmes, fotos e tabelas de dados estruturados. Ele utiliza comparação altamente eficaz por colunas e algoritmo de codificação personalizável. Análise coletada por e hospedada no G2.com.
Usando o Apache Parquet, há problemas com arquivos grandes. Maior uso de CPU e afeta o desempenho das consultas. Menos eficiente e pode gravar dados mais lentamente do que formatos baseados em linhas, como CSV. Análise coletada por e hospedada no G2.com.

Compressão e armazenamento de dados Armazenamento para grande quantidade de dados e sua recuperação Análise coletada por e hospedada no G2.com.
não suporta json, que é amplamente utilizado para troca e transferência de dados para desenvolvimento multiplataforma e troca de dados na web Análise coletada por e hospedada no G2.com.