En este curso autoguiado, aprenderá sobre el proceso de planificación de soluciones de análisis de datos y los diversos procesos de análisis de datos involucrados. Durante el curso, se considerarán cinco factores clave que indican la necesidad de servicios de AWS específicos para recopilar, procesar, analizar y presentar datos. Esto incluye el aprendizaje de arquitecturas básicas, propuestas de valor y posibles casos de uso. En el curso, se presentan las soluciones y los servicios de AWS que pueden ayudarlo a crear y mejorar las soluciones de análisis de datos.
Nota: Este curso tiene transcripciones o subtítulos localizados. La narración está en inglés. Para mostrar los subtítulos, haga clic en el botón CC en la esquina inferior derecha del reproductor.
Destinatarios previstos
Este curso está dirigido a:
- Arquitectos de datos
- Científicos de datos
- Analistas de datos
Objetivos del curso
En este curso, aprenderá a realizar lo siguiente:
- identificar las características de las soluciones de análisis de datos y las características que indican que tal solución puede ser necesaria
- definir los tipos de datos, incluidos los datos estructurados, semiestructurados y no estructurados
- definir los tipos de almacenamiento de datos, como lagos de datos, AWS Lake Formation, almacenes de datos y Amazon Simple Storage Service (Amazon S3)
- analizar las características del procesamiento por lotes y de transmisiones, y las diferencias entre ellos
- definir cómo se utiliza Amazon Kinesis para procesar los datos de transmisión
- analizar las características de los diferentes sistemas de almacenamiento para datos de origen
- analizar las características de los sistemas de procesamiento de transacciones en línea (OLTP) y de procesamiento analítico en línea (OLAP), con su efecto en la organización de los datos dentro de dichos sistemas
- analizar las diferencias entre los métodos de almacenamiento de datos basados en filas y en columnas
- definir cómo Amazon EMR, AWS Glue y Amazon Redshift trabajan para procesar, limpiar y transformar los datos dentro de una solución de análisis de datos
- analizar el concepto de conformidad con la atomicidad, la consistencia, el aislamiento y la durabilidad (ACID), así como la conformidad con la disponibilidad básica, el estado flexible y la consistencia final (BASE), y el modo en que los procesos de extracción, transformación y carga (ETL) pueden ayudar a garantizar la conformidad
- explorar el concepto de los esquemas de datos y comprender cómo definen los datos y la manera en que se almacena esta información en almacenes de metadatos
- analizar el concepto de datos en contraste con el de información
- reconocer las formas de analizar los datos a fin de generar información para los informes mediante el uso de herramientas, como Amazon QuickSight y Amazon Athena
- definir cómo cooperan los servicios de AWS para la visualización de los datos
Requisitos previos
Recomendamos que quienes asistan a este curso cumplan los siguientes requisitos previos:
- conocimientos prácticos sobre los conceptos de bases de datos
- conocimientos básicos sobre el almacenamiento, el procesamiento y el análisis de datos
- experiencia en sistemas de TI empresariales
Modalidad del curso
Este curso se imparte mediante una combinación de los siguientes métodos:
- Capacitación digital
Duración
- 3,5 horas
Esquema del curso
En este curso, se analizarán los siguientes conceptos:
- Lección 1: Introducción a las soluciones de análisis de datos
- Conceptos de análisis de datos y analítica
- Introducción a los desafíos del análisis de datos
- Lección 2: Volumen (almacenamiento de datos)
- Introducción a Amazon S3
- Introducción a los lagos de datos
- Introducción a los métodos de almacenamiento de datos
- Lección 3: Velocidad (procesamiento de datos)
- Introducción a los métodos de procesamiento de datos
- Introducción al procesamiento de datos por lotes
- Introducción al procesamiento de datos de transmisiones
- Lección 4: Variedad (estructura y tipos de datos)
- Introducción al almacenamiento de datos de origen
- Introducción a los almacenes de datos estructurados
- Introducción a los almacenes de datos semiestructurados y no estructurados
- Lección 5: Veracidad (limpieza y transformación)
- Conocimiento de la integridad de los datos
- Conocimiento de la consistencia de las bases de datos
- Introducción al proceso de ETL
- Lección 6: Valor (elaboración de informes e inteligencia empresarial)
- Introducción al análisis de datos
- Introducción a la visualización de datos
- Lección 7: Aprendizajes clave
- Juntar las piezas
- Pasos siguientes