Meilleures alternatives à Apache Parquet les mieux notées
The best about Apce Parquet is it's ability to handle synchronisation and concurrent connections. It provides efficient data storage speed. Avis collecté par et hébergé sur G2.com.
The daya retrieval speed for concurrent connections Avis collecté par et hébergé sur G2.com.
26 sur 27 Avis au total pour Apache Parquet
Sentiment de l'avis global pour Apache Parquet
Connectez-vous pour consulter les sentiments des avis.

Apache Parquet s'est avéré être un outil inestimable dans ma boîte à outils d'analyse de données. Son stockage en colonnes efficace, sa compatibilité multiplateforme, son support de l'évolution des schémas et ses fonctionnalités d'optimisation des performances ont considérablement amélioré mes tâches de traitement des données. Il a non seulement amélioré ma productivité, mais a également réduit les coûts d'infrastructure. Je recommande vivement Apache Parquet à quiconque traite de grands ensembles de données et recherche une solution de stockage robuste et axée sur la performance. Apache Parquet est devenu une partie essentielle de ma boîte à outils d'analyse de données, et j'attends avec impatience l'innovation et le développement continus de ce fantastique projet open-source. Félicitations à l'équipe de développement de Parquet pour avoir créé un format de stockage de données aussi puissant et convivial ! Avis collecté par et hébergé sur G2.com.
Bien que Parquet prenne en charge l'évolution du schéma, cela ajoute une certaine complexité au processus, surtout lorsqu'il s'agit de changements de schéma complexes. L'évolution du schéma peut nécessiter une planification et une gestion minutieuses pour garantir la cohérence des données et la compatibilité des requêtes. Avis collecté par et hébergé sur G2.com.

La compatibilité est le meilleur atout de l'apache parquet, il est conçu pour la compatibilité avec une large gamme de traitements de données des frameworks et outils comme apache spark, apache hive et apache impala et d'autres outils qui aident à en faire l'un des meilleurs choix. Avis collecté par et hébergé sur G2.com.
Bien qu'il soit l'un des meilleurs choix pour le traitement par lots, il ne prend pas en charge le stockage de données en temps réel. Avis collecté par et hébergé sur G2.com.
La meilleure chose à propos d'Apache Parquet est qu'il résout les exigences de stockage de manière très efficace. Pour autant que j'en ai l'expérience, il réduit les besoins de stockage d'un tiers du stockage de données. Et le support de base du format parquet pourrait remplacer Hadoop à l'avenir. Avis collecté par et hébergé sur G2.com.
Pour l'instant, je ne trouve rien de spécifiquement négatif car je viens de commencer à explorer cela. Mais peut-être que dans le futur, j'aurai des suggestions sur certaines fonctionnalités de cela. Avis collecté par et hébergé sur G2.com.

Il aide à stocker au format en colonnes et à avoir une évolution de schéma. Il aide à convertir les données entre les formats avro et parquet. Ces fichiers peuvent être lus et écrits par de nombreux langages de programmation. Avis collecté par et hébergé sur G2.com.
Pour être très franc, il n'est pas compatible pour gérer une petite échelle de données. Je rencontre des problèmes pour encoder et décoder les données, ce qui affecte ma performance. Il a également un support limité pour les types de données complexes. Avis collecté par et hébergé sur G2.com.

Il stocke les données dans un stockage en colonnes, ce qui est très efficace pour les requêtes analytiques et prend également en charge les algorithmes de compression. Il a également une compatibilité multiplateforme, ce qui le rend facile à intégrer dans les pipelines de traitement de données existants. Avis collecté par et hébergé sur G2.com.
La performance d'écriture peut être améliorée, et cela prend du temps pour l'apprendre. Avis collecté par et hébergé sur G2.com.

L'un des principaux atouts de Parquet est sa compatibilité avec divers cadres de traitement de données, y compris Apache Hive, Apache Spark et Apache Drill. Avis collecté par et hébergé sur G2.com.
Cependant, il y a certaines considérations à garder à l'esprit lors de l'utilisation d'Apache Parquet. Bien qu'il excelle en performance pour les charges de travail axées sur la lecture, l'écriture de données dans des fichiers Parquet peut être plus lente par rapport à d'autres formats comme Apache ORC. Avis collecté par et hébergé sur G2.com.

C'est principalement utile pour stocker une grande quantité de données utilisées pour l'analyse de big data. Apache Parquet réduit les opérations d'entrée/sortie, c'est mieux comparé à d'autres outils. Avis collecté par et hébergé sur G2.com.
Plus complexe à configurer et à maintenir par rapport aux SGBDR comme MySQL. Avis collecté par et hébergé sur G2.com.

la compression est la meilleure caractéristique d'apache parquet car elle offre diverses techniques de compression pour réduire l'espace de stockage et améliorer les performances de lecture. Il prend également en charge plusieurs algorithmes de compression Avis collecté par et hébergé sur G2.com.
Il ne prend pas en charge l'ingestion de données en temps réel, mais c'est un choix parfait pour le traitement par lots des données. Avis collecté par et hébergé sur G2.com.
Biens pour stocker tout type de données massives, y compris des textes, des films, des photos et des tableaux de données structurées. Il utilise une comparaison par colonne très efficace et un algorithme de codage personnalisable. Avis collecté par et hébergé sur G2.com.
En utilisant Apache Parquet, des problèmes avec de grands fichiers. Une utilisation plus élevée du CPU et affecte les performances des requêtes. Moins efficace et peut écrire des données plus lentement que les formats basés sur des lignes comme CSV. Avis collecté par et hébergé sur G2.com.

Compression de données et stockage
Stockage pour une grande quantité de données et leur récupération Avis collecté par et hébergé sur G2.com.
ne prend pas en charge le json qui est largement utilisé pour l'échange et le transfert de données pour le développement multiplateforme et l'échange de données web Avis collecté par et hébergé sur G2.com.