Alternativas de Amazon EMR Mejor Valoradas
64 Amazon EMR Reseñas
Sentimiento General de la Reseña para Amazon EMR
Inicia sesión para ver el sentimiento de la revisión.
EMR we are using for running business logic on large business data received from various sources and third pary vendors Reseña recopilada por y alojada en G2.com.
Auto scaling for task and core nodes is slow and takes more than 15 minutes normally which causes failure of running jobs due to lack of resources on cluster. Reseña recopilada por y alojada en G2.com.

Es muy fácil lanzar o clonar un clúster EMR. Y EMR proporciona capacidades de escalado muy fáciles basadas en contenedores, CPU, instancias spot, uso de flotas de instancias o grupos de instancias. Y EMR es compatible con muchas de las aplicaciones ampliamente utilizadas como Spark, Hive, Hadoop, Trino, Presto, Ranger, Flink, etc. Reseña recopilada por y alojada en G2.com.
Trabajar con instancias Spot en EMR es un poco complicado durante la indisponibilidad de instancias spot cuando necesitas usar instancias en una zona de disponibilidad particular. Muchas soluciones como Databricks proporcionan alternativas que son aún más fáciles de usar. Reseña recopilada por y alojada en G2.com.

Amazon EMR es un producto mucho más poderoso para implementar soluciones de big data sobre Spark, Flink, scoop, etc. Es muy fácil de configurar y proporciona una interfaz de usuario agradable que ayuda mucho en la depuración de trabajos de Spark. Aparte de eso, desde un punto de vista de observabilidad, EMR vuelca todos los registros en S3 y el CloudWatch, lo que eventualmente ayuda a los desarrolladores a depurar problemas de memoria en el clúster. Reseña recopilada por y alojada en G2.com.
No me gusta la interfaz del cuaderno que proporciona, no tiene características como la autocompletación, etc. Reseña recopilada por y alojada en G2.com.

Gran experiencia de usuario e interfaz de usuario
Más rápido
Más escalable
Puede automatizar fácilmente
Leer entrada de múltiples fuentes
Escribir salida a múltiples fuentes
Acepta diferentes tipos de lenguajes de programación Reseña recopilada por y alojada en G2.com.
Arrancar toma tiempo que necesita más paciencia
gran herramienta pero cara, esa es una de las principales desventajas
Aparte de eso, nada, todo se ve genial, la estoy usando todos los días. Reseña recopilada por y alojada en G2.com.
Mis cargas de trabajo se ejecutan más rápido y tengo más tiempo para trabajar en refinar el código, en lugar de simplemente sentarme esperando que se ejecute la consulta. Reseña recopilada por y alojada en G2.com.
No es tan elástico como se promociona. Me gustaría que el clúster escalara en tiempo real. Reseña recopilada por y alojada en G2.com.

Uno de los arquitecturas multicluster para el procesamiento de big data que incluye todo tipo de archivos.
El usuario no necesita preocuparse por el mantenimiento de los clústeres y los clústeres serán reemplazados dinámicamente en caso de fallo.
Es una de las arquitecturas para el procesamiento de map reduce (procesamiento hadoop), puede procesar datos en PB utilizando una arquitectura multihilo. Reseña recopilada por y alojada en G2.com.
> no es sin servidor, es decir, el administrador/usuario necesita aprovisionar manualmente los clústeres para el procesamiento y eliminarlos después del procesamiento
> El costo es comparativamente mayor en comparación con los servicios sin servidor disponibles en AWS
> EMR viene con 2 nodos maestros, si ambos nodos maestros fallan, el clúster EMR se caerá, es decir, los usuarios necesitan aprovisionar un clúster de múltiples zonas de disponibilidad para evitar fallos de nodos Reseña recopilada por y alojada en G2.com.

Facilidad de crear instancias EMR y elegir los softwares necesarios para reinstalar (Spark/Hive/etc.). Reseña recopilada por y alojada en G2.com.
El costo es algo alto y puede ser un factor limitante a veces. Reseña recopilada por y alojada en G2.com.

Planes personalizables por el usuario y eficiencia de costos, y la mejor interfaz de usuario, por supuesto. Reseña recopilada por y alojada en G2.com.
Los procesos en la nube todavía son lentos ya que es virtual, pero sigue siendo una mejor opción. Reseña recopilada por y alojada en G2.com.

No se requiere un multiproceso tradicional, distribuye el trabajo entre el nodo cliente, el mejor y más temprano trabajo encontrado fue usando pspark con un marco de datos con un alto nivel de APIs de Python. Reseña recopilada por y alojada en G2.com.
La plataforma está muy llena, será difícil hacer cambios de configuración en archivos YAML. Reseña recopilada por y alojada en G2.com.