Présentation de l’atelier
Votre collègue est en vacances, vous êtes donc responsable de l’entraînement de l’ingénierie des données de votre organisation pour la journée. Mettez-vous à sa place et découvrez différentes options gérées pour le déplacement des données sur Amazon Web Services (AWS). Tenez compte des modèles d’architecture, des performances et des optimisations des coûts, ainsi que des bonnes pratiques en matière de sécurité, et impressionnez votre collègue à son retour !
Votre collègue vous a fourni un environnement de test (sandbox) pour que vous puissiez expérimenter et tester une preuve de concept (POC) pendant son absence. Vous avez décidé d’explorer les données qui, selon vous, aideront votre petite entreprise à se développer avec succès dans de nouvelles villes. Vous utilisez un jeu de données du National Oceanic and Atmospheric Administration (NOAA, Administration océanique et atmosphérique nationale) qui vous permet d’accéder à l’historique quotidien des données météorologiques. Pour vous, ces données peuvent permettre à votre entreprise de déterminer quand elle doit stocker des éléments d’été ou d’hiver dans les villes où elle se développe. Pour votre POC, vous vous concentrerez sur les métriques de température et de précipitation.
Cet atelier utilise le jeu de données NOAA Global Surface Summary of Day (GSOD), consulté le 5 août 2022 à l’adresse https://registry.opendata.aws/noaa-gsod. Ce jeu de données est un ensemble de relevés météorologiques quotidiens (température, vitesse du vent, humidité, pression, etc.) provenant de plus de 9 000 stations météorologiques à travers le monde. Les données ont d’abord été recueillies par le National Climatic Data Center (Centre national de données climatiques). En raison de durée limité de l’atelier, le jeu de données utilisé ici a été réduit pour inclure un sous-ensemble des années disponibles dans le jeu de données complet.
Objectifs
À la fin de cet atelier, vous pourrez :
- Créer un robot AWS Glue.
- Créer et exécuter une tâche dans AWS Glue Studio.
- Explorer les autorisations requises pour exécuter les robots AWS Glue et les tâches AWS Glue Studio.
- Interroger le catalogue de données AWS Glue à l’aide d’Amazon Athena.
Durée
Cet atelier dure environ 60 minutes.
Signification des icônes
- Remarque : un indice, une directive ou un conseil important.
- En savoir plus : un emplacement où trouver davantage d’informations.
- Tâche terminée : une conclusion ou un récapitulatif de l’atelier.
- Actualisation : moment où vous devez actualiser une page de navigateur web ou une liste pour afficher de nouvelles informations.