在本自主进度课程中,您将了解制定数据分析解决方案计划的流程以及所涉及的各种数据分析流程。本课程将带您了解五个关键因素,这些因素指明了在收集、处理、分析和展现数据方面所需的特定 AWS 服务。课程内容包括学习基本架构、价值主张以及可能遇到的使用案例。本课程将向您介绍 AWS 服务和解决方案,帮助您构建和增强数据分析解决方案。
注意:本课程具有本地化的中文配音和注释/字幕。要显示字幕,请单击播放器右下角的 CC 按钮。
培训对象
本课程面向:
- 数据架构师
- 数据科学家
- 数据分析师
课程目标
在本课程中,您将学习如何:
- 确定数据分析解决方案的特征,以及哪些特征表明可能必须使用此类解决方案
- 定义数据类型,包括结构化、半结构化和非结构化数据
- 定义数据存储类型,例如数据湖、AWS Lake Formation、数据仓库和 Amazon Simple Storage Service (Amazon S3)
- 分析批处理和流处理的特征和差异
- 定义如何使用 Amazon Kinesis 来处理流数据
- 分析各种源数据存储系统的特征
- 分析在线事务处理 (OLTP) 和在线分析处理 (OLAP) 系统的特征以及它们对这些系统中数据组织的影响
- 分析基于行和列的数据存储方法的差异
- 解释 Amazon EMR、AWS Glue 和 Amazon Redshift 分别如何在数据分析解决方案中处理、清理和转换数据
- 分析原子性、一致性、隔离性和持久性 (ACID) 合规概念以及基本可用性、软状态
- 最终一致性 (BASE) 合规概念;了解提取、转换和加载 (ETL) 流程如何帮助确保合规性
- 探索数据模式的概念,并了解它们如何定义数据以及如何将这些信息存储在元存储中
- 分析数据概念与信息概念
- 了解如何使用 Amazon QuickSight 和 Amazon Athena 等工具来分析数据,以形成用于生成报告的信息
- 解释 AWS 服务如何协同工作来可视化数据
前提条件
我们建议参加本课程的人员满足以下先决条件:
- 掌握数据库概念相关知识
- 掌握数据存储、处理和分析的基本知识
- 具有企业 IT 系统经验
授课方式
本课程将结合采用以下方式授课:
- 数字化培训
时长
- 3.5 小时
课程大纲
本课程涵盖以下概念:
第 1 课:数据分析解决方案简介
- 数据分析和数据分析概念
- 数据分析挑战简介
第 2 课:数据量 – 数据存储
- Amazon S3 简介
- 数据湖简介
- 数据存储方法简介
第 3 课:速度 – 数据处理
- 数据处理方法简介
- 批量数据处理简介
- 流数据处理简介
第 4 课:多样性 – 数据结构和类型
- 源数据存储简介
- 结构化数据存储简介
- 半结构化数据和非结构化数据存储简介
第 5 课:真实性 – 清理和转换
- 了解数据完整性
- 了解数据库一致性
- ETL 流程简介
第 6 课:价值 – 报告和商业智能
- 数据分析简介
- 数据可视化简介
第 7 课:要点
- 课程总结
- 接下来该做什么