Alternativas de Google Cloud Dataproc Mejor Valoradas
20 Google Cloud Dataproc Reseñas

Estoy trabajando en Mahindra como ingeniero de nube, todos los casos de uso que tenemos en nuestra empresa en los que trabajaré, como desplegar aplicaciones en instancias de cómputo, GKE y pasar servicios a Cloud Run también. Y en la parte de análisis de datos: usamos Cloud Composer, BigQuery, DataProc Cluster... como almacenamiento usamos Cloud Spanner, GCS, SQL... en el lado de la interfaz de usuario y servicio, Google Cloud está bien. Reseña recopilada por y alojada en G2.com.
La interfaz de usuario de Google Cloud para IAM no es buena, la velocidad tampoco es buena del lado de la red. El equipo de Google también necesita trabajar en la documentación. El equipo de Google también necesita trabajar en la disponibilidad de instancias en todas las regiones. Reseña recopilada por y alojada en G2.com.

1. La eliminación de clústeres inactivos ayuda a ahorrar costos cuando el clúster no está en uso.
2. El escalado automático maneja eficientemente la carga en horas pico.
3. El equipo de soporte de GCP es útil en cualquier problema crítico.
4. El soporte de la API de Java es excelente. La creación de clústeres, el ETL de datos y la eliminación de clústeres se pueden realizar en una sola canalización. Reseña recopilada por y alojada en G2.com.
1. La creación de clústeres toma unos minutos, lo cual no es muy conveniente.
2. A veces, el escalado automático no se activa a tiempo y las canalizaciones fallan con un error de fallo del agente de dataproc. Reseña recopilada por y alojada en G2.com.

Mejores y más baratos servicios proporcionados por Google Cloud y con la mejor escalabilidad y algunos servicios totalmente gestionados con la mejor interfaz de usuario. Reseña recopilada por y alojada en G2.com.
Hay algunos servicios que necesitan algo de claridad, como alguna configuración que está bloqueada por Google mismo. Reseña recopilada por y alojada en G2.com.
That has a lot of services and I especially like the logging. Reseña recopilada por y alojada en G2.com.
The documentation can be chaotic and daunting. I sometimes loose myself there. Reseña recopilada por y alojada en G2.com.

Una gran herramienta que tal vez no sea tan popular como AWS EMR, pero que supera las expectativas. Una implementación elegante. Reseña recopilada por y alojada en G2.com.
El uso del paradigma de Almacenamiento y Procesamiento de GCP puede causar problemas para los usuarios acostumbrados a Hadoop en las instalaciones. Reseña recopilada por y alojada en G2.com.
Google Cloud DataProc es más adecuado para lo siguiente:
Análisis de datos de código abierto, gestionado y escalable
Sin servidor o gestionar clústeres por tu cuenta
Tiene buenas integraciones con otros servicios de GCP
Clúster transitorio seguro y rentable con facturación por segundo
Ecosistema Hadoop en el entorno gestionado de GCP
Fácil de migrar las cargas de trabajo de Hadoop existentes en las instalaciones junto con los almacenes de Hive. Reseña recopilada por y alojada en G2.com.
Los disgustos son los siguientes:
La reducción de escala tiene problemas de rendimiento y otros debido a un período de enfriamiento de la tarea pendiente.
La opción sin servidor debería mejorarse con escalado basado en SLA.
Aún para opciones de transmisión, elija Dataflow.
Todavía utiliza el motor de cómputo, no GKE (Google Kubernetes Engine).
Almacenar datos persistentes de GCS (HCFS - sistema de archivos compatible con Hadoop) desde Dataproc tiene cierta lentitud debido a la separación de cómputo/almacenamiento - es nuestra opción elegir qué almacenamiento para qué procesamiento.
Tiene almacenamiento HDFS asignado con cada clúster de nodos de Dataproc, pero no es bueno para el almacenamiento de grandes cantidades de datos localmente. Reseña recopilada por y alojada en G2.com.

La experiencia en Dev-Ops es amigable, es muy fácil de usar. Ofrece casi un 99.9% de tiempo de actividad y velocidad de conexión. Hay mucha documentación disponible en su sitio web. Un usuario normal de sitios web siempre busca soluciones económicas. Google ofrece un servicio en la nube gratuito de 300 dólares por 1 año, lo cual es muy atractivo para los usuarios de sitios web pequeños.
Estos son muy escalables. Reseña recopilada por y alojada en G2.com.
Entrada tardía en el marketing de la nube.
Menos características y servicios.
Algunas características todavía están en la versión Beta.
Menos centros de datos en todo el mundo. Reseña recopilada por y alojada en G2.com.

Que es sin servidor - no hay infraestructura que gestionar. Gran ventaja. Puntos extra por tener Spark (más API's), Hive y Hadoop preinstalados en los clústeres. La opcionalidad de lanzar clústeres de instancias gestionadas también es bastante agradable de tener. Reseña recopilada por y alojada en G2.com.
Es una decisión difícil: o la falta de capacidades de administración y monitoreo empresarial, o la incapacidad de expandirse de manera flexible más allá de la tarifa plana de capacidad fija. Reseña recopilada por y alojada en G2.com.
I like the ease of use for building clusters quickly and efficiently. At the same time I can resize them at any moment in time. I have plenty of nodes so that I don't have to be concerned about pipelines outgrowing my clusters. I like how the price is based on actual use, and that they gave me a $300 credit towards my project. Reseña recopilada por y alojada en G2.com.
Sometimes it can be not user friendly and clusters can take time to re start. Otherwise I have no other complaints. Reseña recopilada por y alojada en G2.com.
The best way to manage Spark and Hadoop service that has been offered on the Google Cloud Platform. Reseña recopilada por y alojada en G2.com.
it doesn’t work with custom sources. For the standard computer, it is still the most expensive component Reseña recopilada por y alojada en G2.com.