Top-bewertete Apache Parquet Alternativen

Es ist hauptsächlich nützlich zum Speichern großer Datenmengen, die für Big-Data-Analysen verwendet werden. Apache Parquet reduziert IO-Operationen, es ist besser im Vergleich zu anderen Tools. Bewertung gesammelt von und auf G2.com gehostet.
Komplexer einzurichten und zu warten im Vergleich zu RDBMS wie MySQL. Bewertung gesammelt von und auf G2.com gehostet.
26 von 27 Gesamtbewertungen für Apache Parquet
Gesamtbewertungsstimmung für Apache Parquet
Melden Sie sich an, um die Bewertungsstimmung zu sehen.

Apache Parquet hat sich als ein unschätzbares Werkzeug in meinem Datenanalyse-Werkzeugkasten erwiesen. Seine effiziente spaltenorientierte Speicherung, plattformübergreifende Kompatibilität, Unterstützung der Schema-Evolution und Leistungsoptimierungsfunktionen haben meine Datenverarbeitungsaufgaben erheblich verbessert. Es hat nicht nur meine Produktivität gesteigert, sondern auch die Infrastrukturkosten reduziert. Ich empfehle Apache Parquet jedem, der mit großen Datensätzen arbeitet und eine robuste, leistungsorientierte Speicherlösung sucht. Apache Parquet ist ein wesentlicher Bestandteil meines Datenanalyse-Toolkits geworden, und ich freue mich auf weitere Innovationen und Entwicklungen in diesem fantastischen Open-Source-Projekt. Lob an das Parquet-Entwicklungsteam für die Schaffung eines so leistungsstarken und benutzerfreundlichen Datenspeicherformats! Bewertung gesammelt von und auf G2.com gehostet.
Während Parquet die Schema-Evolution unterstützt, fügt es dem Prozess dennoch eine gewisse Komplexität hinzu, insbesondere bei der Bewältigung komplexer Schemaänderungen. Die Schema-Evolution kann eine sorgfältige Planung und Verwaltung erfordern, um Datenkonsistenz und Abfragekompatibilität sicherzustellen. Bewertung gesammelt von und auf G2.com gehostet.

Kompatibilität ist das Beste an Apache Parquet, es ist für die Kompatibilität innerhalb einer breiten Palette von Datenverarbeitungs-Frameworks und -Tools wie Apache Spark, Apache Hive und Apache Impala sowie anderen Tools ausgelegt, die dazu beitragen, es zu einer der besten Wahl zu machen. Bewertung gesammelt von und auf G2.com gehostet.
Obwohl es eine der besten Optionen für die Stapelverarbeitung ist, unterstützt es keine Echtzeit-Datenspeicherung. Bewertung gesammelt von und auf G2.com gehostet.
Das Beste an Apache Parquet ist, dass es die Speicheranforderungen sehr effizient löst. Soweit ich Erfahrung habe, reduziert es den Speicherbedarf um ein Drittel des Datenspeichers. Und die Parquet-Format-Basisunterstützung könnte in Zukunft Hadoop ersetzen. Bewertung gesammelt von und auf G2.com gehostet.
Im Moment finde ich nichts Spezielles als Nachteil, da ich gerade erst begonnen habe, dies zu erkunden. Aber vielleicht habe ich in Zukunft einige Vorschläge zu einigen Funktionen davon. Bewertung gesammelt von und auf G2.com gehostet.

Es hilft, Daten im Spaltenformat zu speichern und eine Schema-Evolution zu haben. Es hilft, Daten zwischen Avro- und Parquet-Formaten zu konvertieren. Diese Dateien können von vielen Programmiersprachen gelesen und geschrieben werden. Bewertung gesammelt von und auf G2.com gehostet.
Um ganz ehrlich zu sein, ist es nicht kompatibel, um mit kleinen Datenmengen umzugehen. Ich habe Probleme beim Kodieren und Dekodieren der Daten, was meine Leistung beeinträchtigt. Es hat auch eine begrenzte Unterstützung für komplexe Datentypen. Bewertung gesammelt von und auf G2.com gehostet.

Es speichert Daten in spaltenbasierter Speicherung, die für analytische Abfragen hoch effizient ist und unterstützt auch Komprimierungsalgorithmen. Es hat auch plattformübergreifende Kompatibilität, was die Integration in bestehende Datenverarbeitungspipelines erleichtert. Bewertung gesammelt von und auf G2.com gehostet.
Schreibgeschwindigkeit kann verbessert werden, und es braucht einige Zeit, um es zu lernen. Bewertung gesammelt von und auf G2.com gehostet.

Eine der Hauptstärken von Parquet ist seine Kompatibilität mit verschiedenen Datenverarbeitungs-Frameworks, einschließlich Apache Hive, Apache Spark und Apache Drill. Bewertung gesammelt von und auf G2.com gehostet.
Es gibt jedoch einige Überlegungen, die bei der Verwendung von Apache Parquet zu beachten sind. Während es bei leseintensiven Arbeitslasten in der Leistung hervorragend ist, kann das Schreiben von Daten in Parquet-Dateien im Vergleich zu anderen Formaten wie Apache ORC langsamer sein. Bewertung gesammelt von und auf G2.com gehostet.

Die Komprimierung ist die beste Eigenschaft von Apache Parquet, da es verschiedene Komprimierungstechniken bietet, um Speicherplatz zu reduzieren und die Leseleistung zu verbessern. Es unterstützt auch mehrere Komprimierungsalgorithmen. Bewertung gesammelt von und auf G2.com gehostet.
Es unterstützt keine Echtzeit-Datenaufnahme, aber es ist die perfekte Wahl für die Batch-Datenverarbeitung. Bewertung gesammelt von und auf G2.com gehostet.
Waren zur Speicherung jeder Art von massiven Daten, einschließlich Texte, Filme, Fotos und strukturierte Datentabellen. Es nutzt hochwirksame spaltenweise Vergleiche und anpassbare Kodierungsalgorithmen. Bewertung gesammelt von und auf G2.com gehostet.
Verwendung von Apache Parquet hat Probleme mit großen Dateien. Höhere CPU-Auslastung und beeinträchtigt die Abfrageleistung. Weniger effizient und kann Daten langsamer schreiben als zeilenbasierte Formate wie CSV. Bewertung gesammelt von und auf G2.com gehostet.

Datenkompression und -speicherung
Speicherung großer Datenmengen und deren Abruf Bewertung gesammelt von und auf G2.com gehostet.
Unterstützt kein JSON, das häufig für den Datenaustausch und die Übertragung für plattformübergreifende und Webentwicklungs-Datenaustausch verwendet wird. Bewertung gesammelt von und auf G2.com gehostet.
As it is free and open source so we use this and there are also some advantages of Apache parquet.
Also it consumes very less space compared to its competitives. Bewertung gesammelt von und auf G2.com gehostet.
As it is free and open source but still HBase is more popular and we in our organisation are using HBase. I am not criticizing but we people go for popularity and easa of usability. Bewertung gesammelt von und auf G2.com gehostet.