Al evaluar las dos soluciones, los revisores encontraron que AWS Data Pipeline es más fácil de usar. Sin embargo, AWS Glue es más fácil de configurar y administrar. Además, prefirieron hacer negocios en general con AWS Glue.
Data Pipeline integrates really well with EMR, and it's easy to deploy pipelines via cloudformation making automation possible. We use it to manage complex map-reduce workflows and it usually works pretty smoothly.
El Data Pipeline puede ser una caja negra a veces. Los mensajes de error no son buenos, y es difícil entender qué falló exactamente ya que es un servicio de Amazon. El programador no da notificaciones oportunas a veces, por lo que es difícil determinar el...
Me gusta que esto sea sin servidor. Así que no necesitamos preocuparnos por la infraestructura y podemos escribir el código para procesar una gran cantidad de datos en poco tiempo.
AWS Glue no es fácil de usar, los componentes de transformación que tenemos no son útiles en diferentes escenarios y necesitamos usar transformaciones personalizadas para todo, incluyendo incluso operaciones muy básicas.
Data Pipeline integrates really well with EMR, and it's easy to deploy pipelines via cloudformation making automation possible. We use it to manage complex map-reduce workflows and it usually works pretty smoothly.
Me gusta que esto sea sin servidor. Así que no necesitamos preocuparnos por la infraestructura y podemos escribir el código para procesar una gran cantidad de datos en poco tiempo.
El Data Pipeline puede ser una caja negra a veces. Los mensajes de error no son buenos, y es difícil entender qué falló exactamente ya que es un servicio de Amazon. El programador no da notificaciones oportunas a veces, por lo que es difícil determinar el...
AWS Glue no es fácil de usar, los componentes de transformación que tenemos no son útiles en diferentes escenarios y necesitamos usar transformaciones personalizadas para todo, incluyendo incluso operaciones muy básicas.