
O que mais valorizo no AWS Glue é que permite construir e automatizar processos ETL dentro do ecossistema da AWS sem ter que gerenciar infraestrutura diretamente. A integração com serviços como S3, Athena, IAM, Glue Data Catalog e Step Functions facilita bastante a orquestração de pipelines de dados. Também é útil poder trabalhar com jobs em PySpark e manter uma arquitetura mais escalável para processamento e transformação de dados. Em geral, reduz o esforço operacional e acelera a implementação de pipelines em ambientes cloud. Análise coletada por e hospedada no G2.com.
O que menos gosto é que a depuração de erros nem sempre é simples, especialmente em jobs com PySpark ou quando surgem falhas de configuração relacionadas a permissões, rede ou catálogos. A curva de aprendizado também pode ser um pouco alta se não houver experiência prévia com serviços de dados na AWS. Além disso, alguns tempos de inicialização e execução podem parecer pesados para cargas pequenas, e o monitoramento poderia ser mais claro em certos cenários. Análise coletada por e hospedada no G2.com.




