Principais Alternativas de Amazon EMR Mais Bem Avaliadas
Avaliações 64 Amazon EMR
Sentimento Geral da Revisão para Amazon EMR
Entre para ver o sentimento das avaliações.
EMR we are using for running business logic on large business data received from various sources and third pary vendors Análise coletada por e hospedada no G2.com.
Auto scaling for task and core nodes is slow and takes more than 15 minutes normally which causes failure of running jobs due to lack of resources on cluster. Análise coletada por e hospedada no G2.com.

É muito fácil lançar ou clonar um cluster EMR. E o EMR oferece capacidades de escalonamento muito fáceis com base em contêineres, CPU, instâncias spot, uso de frota de instâncias ou grupos de instâncias. E o EMR suporta muitas das aplicações amplamente utilizadas, como Spark, Hive, Hadoop, Trino, Presto, Ranger, Flink, etc. Análise coletada por e hospedada no G2.com.
Trabalhar com instâncias Spot no EMR é um pouco complicado durante a indisponibilidade de instâncias spot quando você precisa usar instâncias em uma zona de disponibilidade específica. Muitas soluções como o Databricks fornecem fallback que são ainda mais fáceis de usar. Análise coletada por e hospedada no G2.com.

Amazon EMR é um produto muito mais poderoso para implantar soluções de big data em cima de Spark, Flink, scoop, etc. É muito fácil de configurar e fornece uma interface de usuário agradável que ajuda bastante na depuração de trabalhos Spark. Além disso, do ponto de vista de observabilidade, o EMR despeja todos os logs no S3 e no CloudWatch, o que eventualmente ajuda os desenvolvedores a depurar problemas de memória no cluster. Análise coletada por e hospedada no G2.com.
Eu não gosto da interface do notebook que ele fornece, não tem recursos como auto-completação etc. Análise coletada por e hospedada no G2.com.

Ótima Experiência do Usuário e Interface do Usuário
Mais rápido
Mais escalável
Pode automatizar facilmente
Ler entrada de várias fontes
Escrever saída para várias fontes
Aceita diferentes tipos de linguagem de programação Análise coletada por e hospedada no G2.com.
Inicializar leva tempo, o que requer mais paciência
ótima ferramenta, mas cara, essa é uma das principais desvantagens
Fora isso, nada, tudo parece ótimo, estou usando todos os dias. Análise coletada por e hospedada no G2.com.
Meus workloads são executados mais rapidamente e tenho mais tempo para trabalhar no refinamento do código, em vez de apenas ficar sentado esperando a consulta ser executada. Análise coletada por e hospedada no G2.com.
Não é tão elástico quanto promovido. Eu gostaria que o cluster escalasse em tempo real. Análise coletada por e hospedada no G2.com.

> Uma das arquiteturas multicluster para processamento de big data que inclui todos os tipos de arquivos
> O usuário não precisa se preocupar com a manutenção dos clusters e os clusters serão substituídos dinamicamente com base em falhas
> É uma das arquiteturas para processamento de map reduce (processamento hadoop), pode processar dados em PB usando arquitetura multithread Análise coletada por e hospedada no G2.com.
> não é sem servidor, ou seja, o administrador/usuário precisa provisionar manualmente os clusters para processamento e excluí-los após o processamento
> O custo é comparativamente maior em comparação com os serviços sem servidor disponíveis na AWS
> O EMR vem com 2 nós mestres, se ambos os nós mestres falharem, o cluster EMR cairá, ou seja, os usuários precisam provisionar um cluster multi-AZ para evitar falhas de nós Análise coletada por e hospedada no G2.com.

Facilidade de criar instâncias EMR e escolher os Softwares necessários para serem reinstalados (Spark/Hive/etc.). Análise coletada por e hospedada no G2.com.
O custo é um pouco alto e pode ser um fator limitante às vezes. Análise coletada por e hospedada no G2.com.

Planos personalizáveis pelo usuário e eficiência de custo, e a melhor interface do usuário, é claro. Análise coletada por e hospedada no G2.com.
Os processos em nuvem ainda são lentos, pois são virtuais, mas ainda assim é uma escolha melhor. Análise coletada por e hospedada no G2.com.

Nenhum multiprocesso tradicional é necessário, distribui o trabalho entre o nó cliente, o melhor e mais antigo trabalho encontrado foi usando pspark com um quadro de dados com um alto nível de APIs Python. Análise coletada por e hospedada no G2.com.
A plataforma está densamente compactada, será difícil fazer alterações de configuração em arquivos YAML. Análise coletada por e hospedada no G2.com.