Alternativas de Apache Pig Mejor Valoradas
It is easy to learn and get into production. It automates important MapReduce tasks into SQL kind queries. Reseña recopilada por y alojada en G2.com.
- Not all tasks in Big Data can be completed using pig. Reseña recopilada por y alojada en G2.com.
20 de 21 Reseñas totales para Apache Pig
Sentimiento General de la Reseña para Apache Pig
Inicia sesión para ver el sentimiento de la revisión.

Apache Pig y su lenguaje de consulta (Pig Latin) nos permitieron crear flujos de datos con facilidad. El lenguaje está diseñado para reflejar la forma en que se diseñan los flujos de datos, por lo que descarta datos innecesarios, admite funciones definidas por el usuario (UDFs) y ofrece mucho control sobre el flujo de datos. Reseña recopilada por y alojada en G2.com.
El lenguaje Pig, al ser un lenguaje codicioso, no evaluará los datos hasta que realmente se necesiten. Por lo tanto, los errores no son visibles a menos que realmente intentes volcar/imprimir los datos. No hay una funcionalidad de "depuración" para ejecutar el código en un modo de prueba. Reseña recopilada por y alojada en G2.com.
Lo que más me gusta de Apache Pig es lo eficientemente que podemos escribir cualquiera de nuestros trabajos complejos de map reduce o spark sin tener un conocimiento profundo de Java, Python, Groovy. Además, es fácil controlar la ejecución del trabajo con la ayuda de pig. Reseña recopilada por y alojada en G2.com.
Lo que no me gusta de Apache Pig es que la depuración de errores consume la mayor parte de su tiempo de desarrollo, ya que a veces puede ser inmaduro/inestable. Además, la comunidad de soporte es mucho menor en comparación con la de Hadoop MapReduce o Spark. Reseña recopilada por y alojada en G2.com.

Puede manejar algunas de las operaciones matemáticas simples, junto con la reducción de los datos. Agregar los datos es extremadamente útil. Ejecutar funcionalidades de DateTime en Apache Pig es realmente una característica útil para obtener resultados más rápidos. Pig trabaja con conjuntos de datos de alrededor de 150 a 180 GB por mes y los reduce eficientemente en, digamos, 10 a 12 minutos. Recomendaría Apache Pig a cualquier persona con conocimientos básicos de codificación en el campo de la ingeniería de transporte, especialmente cuando se necesita manejar grandes conjuntos de datos. Reseña recopilada por y alojada en G2.com.
No puede realizar operaciones secuenciales, como tomar líneas consecutivas y luego compararlas. Sin embargo, la solución alternativa es clasificar los segmentos, fusionarlos y luego realizar la tarea. El principal inconveniente sigue siendo el hecho de que no se puede utilizar para realizar bucles y bucles anidados en cualquier variable(s). Hive podría ser una mejor opción en ciertos casos por esa razón. Reseña recopilada por y alojada en G2.com.
Less number of instructions does big tasks of collecting, loading, consolidating the data. Reseña recopilada por y alojada en G2.com.
Not enough tools to debug
Incorrect/misleading exceptions Reseña recopilada por y alojada en G2.com.

Apache Pig es un compilador de primer paso, que es mejor utilizando DAG. Reseña recopilada por y alojada en G2.com.
Si quieres profundizar y usar estructuras complejas, no es la mejor manera. Reseña recopilada por y alojada en G2.com.
1. Ease of use, its performance
2. MapReduce is fully abstracted
3. Ability to chain multiple MR jobs into a single Pig script
4. Allows you quickly to crank through big data to get some analytics done Reseña recopilada por y alojada en G2.com.
1. Slower in performance compared to Spark
2. Less support e.g String concatenation only allows 2 at a time, cannot sort & filter inside Group BY, etc
3. Cannot read in other forms of input like csv as parquet, what Spark can do
4. Error handling needs to be better. Not easy to debug UDFs Reseña recopilada por y alojada en G2.com.
- SQL like syntax
- powerful and feature-rich Reseña recopilada por y alojada en G2.com.
- Much more difficult to use than Hive
- takes a while to get used to and learn as compared with Hive Reseña recopilada por y alojada en G2.com.

Creación de UDAF's fácilmente.
Lenguajes Pig manejables y fáciles de escribir.
Pueden ser transmitidos a través de Python y guionizados en lugar de escribir un trabajo MR. Reseña recopilada por y alojada en G2.com.
no tan verdaderamente escalable como escribir un trabajo MR.
las uniones son fáciles, pero no tan fáciles como las consultas de hive
no maneja parquet muy bien
no tan rápido y flexible como spark Reseña recopilada por y alojada en G2.com.

El ecosistema y la forma en que funciona. Poder implementar e integrar lo que actualmente usas. Reseña recopilada por y alojada en G2.com.
Creo que empezar es un poco irregular, pero una vez que estás familiarizado y acostumbrado, puede ser muy útil. Reseña recopilada por y alojada en G2.com.