
Lo que más valoro de AWS Glue es que permite construir y automatizar procesos ETL dentro del ecosistema de AWS sin tener que administrar infraestructura directamente. La integración con servicios como S3, Athena, IAM, Glue Data Catalog y Step Functions facilita bastante la orquestación de pipelines de datos. También es útil poder trabajar con jobs en PySpark y mantener una arquitectura más escalable para procesamiento y transformación de datos. En general, reduce esfuerzo operativo y acelera la implementación de pipelines en entornos cloud. Reseña recopilada por y alojada en G2.com.
Lo que menos me gusta es que la depuración de errores no siempre es sencilla, especialmente en jobs con PySpark o cuando aparecen fallos de configuración relacionados con permisos, red o catálogos. La curva de aprendizaje también puede ser algo alta si no se tiene experiencia previa con servicios de datos en AWS. Además, algunos tiempos de arranque y ejecución pueden sentirse pesados para cargas pequeñas, y el monitoreo podría ser más claro en ciertos escenarios. Reseña recopilada por y alojada en G2.com.




