Panoramica del laboratorio
In questo laboratorio procederai all’abilitazione della crittografia dei dati inattivi lato client utilizzando la chiave gestita dal Servizio AWS di gestione delle chiavi (AWS KMS) per i dati archiviati in Amazon Simple Storage Service (Amazon S3) con il file system EMR (EMRFS). Utilizzando Amazon EMR, creerai una configurazione di sicurezza per crittografare l’oggetto scritto su S3 con la crittografia lato client mediante la chiave gestita da AWS KMS da te specificata e decrittograferai gli oggetti con la stessa chiave utilizzata per crittografarli. Ciò ti consentirà di sfruttare più facilmente framework come Apache Spark, Apache Tez e Apache Hadoop MapReduce su Amazon EMR per eseguire analisi dei Big Data, elaborazione streaming, machine learning e carichi di lavoro ETL su dati riservati.
Obiettivi
Alla fine di questo laboratorio sarai in grado di:
- Creare un bucket Amazon S3.
- Creare una chiave utilizzando AWS KMS.
- Creare una configurazione di sicurezza in EMR per abilitare la crittografia lato client utilizzando la chiave gestita da AWS KMS.
- Lanciare un cluster Amazon EMR utilizzando la Console di gestione AWS.
- Leggere e scrivere oggetti da e verso Amazon S3 utilizzando il file system EMR (EMRFS).
- Visualizzare i dati di output EMR direttamente da Amazon S3.
Competenze tecniche preliminari
Per completare con successo questo laboratorio, è necessario avere familiarità con i concetti di base di Hadoop e Hadoop Distributed File System (HDFS). Dovresti inoltre avere una buona conoscenza dell’amministrazione di base dei server Linux e saper usare gli strumenti Linux a riga di comando.
Legenda icone
In questo laboratorio vengono utilizzate varie icone per richiamare l’attenzione su diversi tipi di istruzioni e note. Nell’elenco seguente viene illustrato lo scopo di ciascuna di esse:
- Attenzione: informazioni di particolare interesse o importanza, non così importanti da causare problemi alle apparecchiature o ai dati se non si rispettano, ma che potrebbero comportare la necessità di ripetere determinati passaggi.
- Avviso: un’azione irreversibile e che potrebbe provocare la mancata esecuzione di un comando o di un processo. Include avvisi su configurazioni che sarà impossibile modificare dopo l’esecuzione.
- Attività completata: una conclusione o un punto riepilogativo del laboratorio.
- Nota: una nota, un suggerimento o indicazioni importanti.
- Aggiorna: un momento in cui potrebbe essere necessario aggiornare un elenco o una pagina del browser web per mostrare nuove informazioni.
- Comando: un comando da eseguire.
- Output previsto: un output di esempio che puoi utilizzare per verificare l’output di un comando o di un file modificato.