本课程内容涉及机器学习 (ML) 生命周期中数据准备阶段的部分内容。在本课程中,您将学习数据基础知识,包括如何识别数据类型、区分有效数据与无效数据,以及如何可视化和分析数据。您将了解 ML 过程中使用的一些核心 Amazon Web Services (AWS) 存储服务,例如 Amazon Simple Storage Service (Amazon S3)。本课程将介绍如何根据您的具体 ML 需求选择最有效的 AWS 存储决策和数据格式。最后,您将详细了解一些有助于摄取、提取和合并数据的 AWS 服务,例如 Amazon Kinesis。
- 课程级别:300
- 时长:60 分钟
注意:本课程具有本地化的注释/字幕。 旁白保留英语。 要显示字幕,请单击播放器右下角的 CC 按钮。
课程内容
- 线上材料
- 演示
- 知识考核问题
- 课程评估
课程目标
- 描述数据收集的基础知识。
- 定义数据格式和摄取机制。
- 描述可视化数据的不同方法。
- 描述用于 ML 数据收集的 AWS 存储选项,包括使用案例和权衡。
- 根据成本、性能和数据结构选择最有效的存储决策。
- 根据数据访问模式为 ML 任务选择适当的数据格式。
- 描述用于数据摄取的 AWS 流数据来源。
- 使用有助于数据传输的 AWS 服务从 AWS 存储服务中提取数据。
- 描述如何合并来自多个来源的数据。
- 确定涉及容量和可扩展性的数据摄取和存储问题的原因。
培训对象
- 云架构师
- 机器学习工程师
建议具备的技能
- 拥有至少 1 年使用 Amazon SageMaker 和其他 AWS 服务进行 ML 工程工作的经验。
- 至少从事 1 年相关角色的工作,例如后端软件开发人员、DevOps 开发人员、数据工程师或数据科学家。
- 对 Python 等编程语言有基本的了解。
- 已完成 AWS ML Engineer Associate 学习计划的前几门课程。
课程大纲
- 第 1 部分:简介
- 第 1 课:如何学习本课程
- 第 2 课:领域 1 简介
- 第 3 课:课程概览
- 第 4 课:数据收集基础知识
- 第 2 部分:数据收集
- 第 5 课:数据类型
- 第 6 课:数据可视化和探索性数据分析
- 第 3 部分:AWS 数据来源和服务
- 第 7 课:AWS 存储选项
- 第 8 课:选择存储
- 第 4 部分:摄取、提取和合并数据
- 第 9 课:数据摄取
- 第 10 课:数据提取
- 第 11 课:数据合并
- 第 12 课:数据摄取和存储故障排除
- 第 5 部分:结论
- 第 13 课:课程总结
- 第 14 课:评估
- 第 15 课:联系我们