
Ce que j'apprécie le plus d'AWS Glue, c'est qu'il permet de construire et d'automatiser des processus ETL au sein de l'écosystème AWS sans avoir à gérer directement l'infrastructure. L'intégration avec des services comme S3, Athena, IAM, Glue Data Catalog et Step Functions facilite grandement l'orchestration des pipelines de données. Il est également utile de pouvoir travailler avec des jobs en PySpark et de maintenir une architecture plus évolutive pour le traitement et la transformation des données. En général, cela réduit l'effort opérationnel et accélère la mise en œuvre des pipelines dans des environnements cloud. Avis collecté par et hébergé sur G2.com.
Ce que j'aime le moins, c'est que le débogage des erreurs n'est pas toujours simple, surtout dans les tâches avec PySpark ou lorsque des erreurs de configuration liées aux permissions, au réseau ou aux catalogues apparaissent. La courbe d'apprentissage peut également être assez élevée si l'on n'a pas d'expérience préalable avec les services de données sur AWS. De plus, certains temps de démarrage et d'exécution peuvent sembler lourds pour de petites charges, et la surveillance pourrait être plus claire dans certains scénarios. Avis collecté par et hébergé sur G2.com.




