Panoramica del laboratorio
Hai avviato una piccola piattaforma di crowdsourcing e hai creato un portafoglio di applicazioni mobili e Web che consente ai consumatori di produrre contenuti in base agli eventi attuali. Inizialmente, hai utilizzato un database MySQL in esecuzione su un’istanza Amazon EC2 per supportare le tue applicazioni. Man mano che il business cresceva, hai iniziato a cercare una soluzione più scalabile per gestire i requisiti del database e alcune sfide riscontrate durante l’hosting del database. Dopo aver analizzato le offerte di mercato, hai deciso di utilizzare Amazon Aurora per i tuoi carichi di lavoro in crescita.
Durante lo sviluppo della nuova applicazione, hai notato prestazioni scadenti durante il recupero dei dati dal database Aurora. Sospetti che il problema possa essere correlato a una struttura scadente di query. Utilizzerai diversi strumenti in Amazon Aurora per trovare le query problematiche e ottimizzarle.
Amazon Aurora è un motore di database relazionale creato per il cloud, compatibile con MySQL e PostgreSQL. Aurora è completamente gestito da Amazon Relational Database Service (RDS), che automatizza le attività amministrative che richiedono molto tempo quali il provisioning dell’hardware, la configurazione dei database, l’applicazione di patch e l’esecuzione di backup. Aurora è costruito su un moderno e apposito sistema di archiviazione distribuito. Tutti i dati sono distribuiti in tre diverse zone di disponibilità AWS, su centinaia di nodi di archiviazione, con due copie per zona. I motori di database di Aurora, compatibili con MySQL e PostgreSQL, sono personalizzati per sfruttare la rapida archiviazione distribuita.
In questo laboratorio, utilizzerai il set di dati di IMDb per testare il cluster Amazon RDS Aurora. Utilizzerai i log delle query non performanti e Amazon RDS Performance Insights per valutarle. Quindi, perfezionerai le query e valuterai i guadagni di prestazioni. Imparerai inoltre a configurare il ridimensionamento automatico per le repliche di lettura nel cluster Amazon Aurora per ridurre gli impatti sulle prestazioni in caso di picchi di carico. Durante questa attività, esaminerai diversi parametri disponibili per ottimizzare le prestazioni del database per il carico di lavoro.
Obiettivi
Dopo aver completato questo laboratorio, sarai in grado di:
- Abilitare i log per le query non performanti in Amazon RDS per indagare su query MySQL con prestazioni inferiori
- Indagare sulle prestazioni con Amazon RDS Performance Insights
- Usare le best practice per ottimizzare le query MySQL
- Utilizzare la funzione di dimensionamento automatico della replica di lettura di Aurora per affrontare aumenti improvvisi del carico
Prerequisiti
Questo laboratorio richiede:
-
Accesso a un notebook dotato di Wi-Fi e Microsoft Windows, macOS o Linux (Ubuntu, SuSE o Red Hat)
Nota L’ambiente di laboratorio non è accessibile utilizzando un iPad o un tablet, ma è possibile utilizzare tali dispositivi per accedere alla guida per gli studenti.
-
Per gli utenti di Microsoft Windows, è necessario l’accesso al computer come amministratore
-
Un browser Internet come Chrome, Firefox o Internet Explorer 9 (non sono supportate versioni precedenti di Internet Explorer)
-
Uso di un client SSH come PuTTY.
-
Familiarità con la sintassi e il funzionamento del database MySQL
Durata
Ci vorranno 90 minuti per completare questo laboratorio.