Meilleures alternatives à Amazon EMR les mieux notées
Avis sur 64 Amazon EMR
Sentiment de l'avis global pour Amazon EMR
Connectez-vous pour consulter les sentiments des avis.
EMR we are using for running business logic on large business data received from various sources and third pary vendors Avis collecté par et hébergé sur G2.com.
Auto scaling for task and core nodes is slow and takes more than 15 minutes normally which causes failure of running jobs due to lack of resources on cluster. Avis collecté par et hébergé sur G2.com.

Il est très facile de lancer ou de cloner un cluster EMR. Et EMR offre des capacités de mise à l'échelle très faciles basées sur des conteneurs, des CPU, des instances spot, l'utilisation de flotte d'instances ou de groupes d'instances. Et EMR prend en charge de nombreuses applications largement utilisées comme Spark, Hive, Hadoop, Trino, Presto, Ranger, Flink, etc. Avis collecté par et hébergé sur G2.com.
Travailler avec des instances Spot sur EMR est légèrement compliqué lors de l'indisponibilité des instances Spot lorsque vous devez utiliser des instances dans une zone de disponibilité particulière. De nombreuses solutions comme Databricks offrent un repli qui est encore plus facile à utiliser. Avis collecté par et hébergé sur G2.com.

Amazon EMR est un produit beaucoup plus puissant pour déployer des solutions big data sur Spark, Flink, scoop, etc. Il est très facile à configurer et offre une belle interface utilisateur qui aide beaucoup à déboguer les tâches Spark. En dehors de cela, du point de vue de l'observabilité, EMR déverse tous les journaux sur S3 et le cloud watch, ce qui aide finalement les développeurs à déboguer les problèmes de mémoire dans le cluster. Avis collecté par et hébergé sur G2.com.
Je n'aime pas l'interface du carnet qu'il fournit, elle n'a pas de fonctionnalités comme l'auto-complétion, etc. Avis collecté par et hébergé sur G2.com.

Grande expérience utilisateur et interface utilisateur
Plus rapide
Plus évolutif
Lire l'entrée de plusieurs sources
Écrire la sortie vers plusieurs sources
Accepté différents types de langages de programmation Avis collecté par et hébergé sur G2.com.
Le démarrage prend du temps, ce qui nécessite plus de patience.
Excellent outil mais cher, c'est l'un des principaux inconvénients.
À part cela, rien, tout semble parfait, je l'utilise tous les jours. Avis collecté par et hébergé sur G2.com.
Mes charges de travail s'exécutent plus rapidement et j'ai plus de temps pour travailler à affiner le code, au lieu de simplement m'asseoir en attendant que la requête s'exécute. Avis collecté par et hébergé sur G2.com.
Ce n'est pas aussi élastique que promu. Je voudrais que le cluster évolue en temps réel. Avis collecté par et hébergé sur G2.com.

> L'une des architectures multi-cluster pour le traitement des big data qui inclut tous les types de fichiers
> L'utilisateur n'a pas besoin de se soucier de la maintenance des clusters et les clusters seront remplacés dynamiquement en cas de défaillance
> C'est l'une des architectures pour le traitement map-reduce (traitement Hadoop), capable de traiter des données en pétaoctets en utilisant une architecture multithreadée Avis collecté par et hébergé sur G2.com.
> ce n'est pas sans serveur, c'est-à-dire que l'administrateur/utilisateur doit provisionner manuellement les clusters pour le traitement, et les supprimer après le traitement
> Le coût est comparativement plus élevé par rapport aux services sans serveur disponibles sur AWS
> EMR est livré avec 2 nœuds maîtres, si les deux nœuds maîtres échouent, le cluster EMR tombera en panne, c'est-à-dire que les utilisateurs doivent provisionner un cluster multi-AZ pour éviter les pannes de nœuds Avis collecté par et hébergé sur G2.com.

Facilité de création d'instances EMR et choix des logiciels requis à réinstaller (Spark/Hive/etc.). Avis collecté par et hébergé sur G2.com.
Le coût est quelque peu élevé et peut parfois être un facteur limitant. Avis collecté par et hébergé sur G2.com.

Plans personnalisables par l'utilisateur et efficacité des coûts, et meilleure interface utilisateur bien sûr. Avis collecté par et hébergé sur G2.com.
Les processus en nuage sont encore lents car ils sont virtuels, mais c'est tout de même un meilleur choix. Avis collecté par et hébergé sur G2.com.

Aucun multiprocessus traditionnel n'est requis, distribue le travail entre le nœud client, le meilleur et le plus ancien travail trouvé utilisait pspark avec un cadre de données avec un niveau élevé d'APIs Python. Avis collecté par et hébergé sur G2.com.
La plateforme est très encombrée, il sera difficile de faire des modifications de configuration sur les fichiers YAML. Avis collecté par et hébergé sur G2.com.