このセルフペースコースでは、データ分析ソリューションを計画するプロセスや、関連するさまざまなデータ分析プロセスについて学びます。このコースでは、データの収集、処理、分析、および表示における特定の AWS のサービスの必要性を示す 5 つの重要な要素について説明します。この内容には、基本的なアーキテクチャ、価値提案、潜在的なユースケースの学習が含まれます。このコースでは、データ分析ソリューションの構築と強化に役立つ AWS のサービスとソリューションを紹介します。
対象者
このコースは以下のような方を対象としています。
- データアーキテクト
- データサイエンティスト
- データアナリスト
コースの目標
このコースで学習する内容
- データ分析ソリューションの特徴と、そのようなソリューションが必要となる可能性があることを示す特性を見極める
- 構造化データ、半構造化データ、非構造化データを含むデータのタイプを定義する
- データレイク、AWS Lake Formation、データウェアハウス、Amazon Simple Storage Service (Amazon S3) などのデータストレージのタイプを定義する
- バッチ処理とストリーム処理の特性および相違点を分析する
- Amazon Kinesis を使用してストリーミングデータを処理する方法を定義する
- ソースデータが異なるストレージシステムの特性を分析する
- オンライントランザクション処理 (OLTP) およびオンライン分析処理 (OLAP) システムの特性と、それらのシステム内のデータ構造への影響を分析する
- 行ベースおよび列指向のデータストレージメソッドの相違点を分析する
- データ分析ソリューション内でデータの処理、クレンジング、変換を実行するために Amazon EMR、AWS Glue、Amazon Redshift がどのように機能するかを定義する
- 基本的な可用性、ソフトステート、結果整合性 (BASE) コンプライアンス、およびコンプライアンス確保における抽出、変換、ロード (ETL) プロセスの有効性に加えて、不可分性、整合性、分離性、耐久性 (ACID) コンプライアンスの概念を分析する
- データスキーマの概念を探り、データの定義方法と、この情報がメタストアに保存される経緯を理解する
- データと情報の概念を分析する
- Amazon QuickSight や Amazon Athena などのツールを使用し、データを分析してレポート用の情報を取り出す方法を把握する
- AWS のサービスが連携してデータを視覚化する仕組みを定義する
前提条件
このコースの受講者には、以下の前提条件を満たしていることが推奨されます。
- データベースの概念に関する実務的知識
- データストレージ、処理、分析に関する基礎知識
- 企業の IT システム部門における経験
実施形式
このコースは、以下の形式を組み合わせて実施します。
- デジタルトレーニング
所要時間
- 3.5 時間
コースの概要
このコースでは以下の概念が扱われます。
- レッスン 1: データ分析ソリューションの紹介
- データ分析とデータ分析の概念
- データ分析における課題の紹介
- レッスン 2: ボリューム (Volume) - データストレージ
- Amazon S3 入門
- データレイクの概要
- データストレージメソッドの概要
- レッスン 3: 速度 (Velocity) - データ処理
- データ処理方法の概要
- バッチデータ処理の概要
- ストリームデータ処理の概要
- レッスン 4: 多様性 (Variety) - データの構造とタイプ
- ソースデータストレージの概要
- 構造化データストアの概要
- 半構造化および非構造化データストアの概要
- レッスン 5: 信憑性 (Veracity) - クレンジングと変換
- データ整合性についての理解
- データベースの整合性についての理解
- ETL プロセスの概要
- レッスン 6: 価値 (Value) - レポート作成とビジネスインテリジェンス
- データ分析の概要
- データ可視化の概要
- レッスン 7: 要点のまとめ
- 情報の整理とまとめ
- 次のステップ