Data Engineering, Big Data and ML on Google Cloud 日本語版
Google Cloud and Google via Coursera Specialization
Overview
この 5 週間のオンライン速習専門講座は、Google Cloud Platform でデータ処理システムを設計、構築する方法を学ぶための実践的な入門コースです。講義、デモ、ハンズオンラボを通して、データ処理システムの設計、エンドツーエンドのデータ パイプラインの構築、データの分析、機械学習の実施方法を学びます。このコースでは、構造化、非構造化、ストリーミングの各種データを扱います。
このコースでは、次のスキルについて学習します。
• Google Cloud Platform 上でデータ処理システムを設計し構築する
• 非構造化データを Cloud Dataproc 上で Spark と ML の API を使って活用する
• バッチおよびストリーミングのデータを処理するために自動スケーリング データ パイプラインを Cloud Dataflow 上で実装する
• 巨大なデータセットからのビジネス分析情報を Google BigQuery を使用して引き出す
• 機械学習モデルを使用したトレーニング、評価、予測を TensorFlow と Cloud ML を使用して行う
• ストリーミング データからの迅速な分析を実現する
このクラスは、デベロッパーとしての経験があり、次のようなビッグデータ変換の管理を担当する方を対象としています。
• データの抽出、読み込み、変換、クリーニング、検証を行う
• データ処理用のパイプラインとアーキテクチャを設計する
• 機械学習モデルと統計モデルを作成して保守する
• データセットに対してクエリを実行し、クエリ結果を視覚化して、レポートを作成する
>>>この専門分野に登録することにより、これはQwiklabsの利用規約に同意し、FAQに記載されています。https://qwiklabs.com/terms_of_service
Syllabus
Course 1: Google Cloud Big Data and Machine Learning Fundamentals 日本語版
- Offered by Google Cloud. このコースでは、データから AI へのライフサイクルをサポートする Google Cloud のビッグデータと機械学習のプロダクトおよびサービスを紹介します。Google Cloud で Vertex AI ... Enroll for free.
Course 2: Modernizing Data Lakes and Data Warehouses with GCP 日本語版
- Offered by Google Cloud. "すべてのデータ パイプラインには、データレイクとデータ ウェアハウスという 2 つの主要コンポーネントがあります。このコースでは、各ストレージ タイプのユースケースを紹介し、Google Cloud ... Enroll for free.
Course 3: Building Batch Data Pipelines on GCP 日本語版
- Offered by Google Cloud. 通常、データ ... Enroll for free.
Course 4: Building Resilient Streaming Analytics Systems on GCP 日本語版
- Offered by Google Cloud. ストリーミングによって企業が事業運営に関するリアルタイムの指標を取得できるようになり、ストリーミング データの処理を行う機会が増えてきました。このコースでは、Google Cloud でストリーミング データ ... Enroll for free.
Course 5: Smart Analytics, Machine Learning, and AI on GCP 日本語版
- Offered by Google Cloud. 機械学習をデータ パイプラインに組み込むことで、企業はデータから効率的に分析情報を抽出できるようになります。このコースでは、必要なカスタマイズの程度に応じて、Google Cloud Platform で機械学習をデータ ... Enroll for free.
- Offered by Google Cloud. このコースでは、データから AI へのライフサイクルをサポートする Google Cloud のビッグデータと機械学習のプロダクトおよびサービスを紹介します。Google Cloud で Vertex AI ... Enroll for free.
Course 2: Modernizing Data Lakes and Data Warehouses with GCP 日本語版
- Offered by Google Cloud. "すべてのデータ パイプラインには、データレイクとデータ ウェアハウスという 2 つの主要コンポーネントがあります。このコースでは、各ストレージ タイプのユースケースを紹介し、Google Cloud ... Enroll for free.
Course 3: Building Batch Data Pipelines on GCP 日本語版
- Offered by Google Cloud. 通常、データ ... Enroll for free.
Course 4: Building Resilient Streaming Analytics Systems on GCP 日本語版
- Offered by Google Cloud. ストリーミングによって企業が事業運営に関するリアルタイムの指標を取得できるようになり、ストリーミング データの処理を行う機会が増えてきました。このコースでは、Google Cloud でストリーミング データ ... Enroll for free.
Course 5: Smart Analytics, Machine Learning, and AI on GCP 日本語版
- Offered by Google Cloud. 機械学習をデータ パイプラインに組み込むことで、企業はデータから効率的に分析情報を抽出できるようになります。このコースでは、必要なカスタマイズの程度に応じて、Google Cloud Platform で機械学習をデータ ... Enroll for free.
Courses
-
このコースでは、データから AI へのライフサイクルをサポートする Google Cloud のビッグデータと機械学習のプロダクトおよびサービスを紹介します。Google Cloud で Vertex AI を使用して、ビッグデータ パイプラインと機械学習モデルを構築するためのプロセス、課題、メリットについて説明します。
-
機械学習をデータ パイプラインに組み込むことで、企業はデータから効率的に分析情報を抽出できるようになります。このコースでは、必要なカスタマイズの程度に応じて、Google Cloud Platform で機械学習をデータ パイプラインに組み込む方法をいくつか説明します。たとえば、ほとんどあるいはまったくカスタマイズが必要ない場合向けの AutoML、機械学習機能の大幅なカスタマイズが必要な場合向けの AI Platform Notebooks と BigQuery Machine Learning を紹介します。また、このコースでは、Kubeflow を使用して機械学習ソリューションを本稼働させる方法についても説明します。受講者は Qwiklabs を使用して、Google Cloud Platform での機械学習モデルの構築を実際に体験することができます。
-
"すべてのデータ パイプラインには、データレイクとデータ ウェアハウスという 2 つの主要コンポーネントがあります。このコースでは、各ストレージ タイプのユースケースを紹介し、Google Cloud で利用可能なデータレイクとデータ ウェアハウスのソリューションを技術的に詳しく説明します。また、データ エンジニアの役割や、効果的なデータ パイプラインが事業運営にもたらすメリットについて確認し、クラウド環境でデータ エンジニアリングを行うべき理由を説明します。
これは「Data Engineering on Google Cloud」シリーズの最初のコースです。このコースを修了したら、「Building Batch Data Pipelines on Google Cloud」コースに登録してください。" -
ストリーミングによって企業が事業運営に関するリアルタイムの指標を取得できるようになり、ストリーミング データの処理を行う機会が増えてきました。このコースでは、Google Cloud でストリーミング データ パイプラインを構築する方法について学習します。受信ストリーミング データの処理のための Pub/Sub について説明します。また、このコースでは、Dataflow を使用してストリーミング データを集計または変換する方法、処理済みのレコードを分析用に BigQuery や Cloud Bigtable に保存する方法についても説明します。そして、Qwiklabs を使用して Google Cloud でストリーミング データ パイプラインのコンポーネントを構築する実践演習を行います。
-
通常、データ パイプラインは、「抽出、読み込み」、「抽出、読み込み、変換」、「抽出、変換、読み込み」のいずれかの枠組みに分類できます。このコースでは、バッチデータではどの枠組みを、どのような場合に使用するのかについて説明します。本コースではさらに、BigQuery、Dataproc 上での Spark の実行、Cloud Data Fusion のパイプラインのグラフ、Dataflow でのサーバーレスのデータ処理など、データ変換用の複数の Google Cloud テクノロジーについて説明します。受講者には、Qwiklabs を使用して Google Cloud でデータ パイプラインのコンポーネントを構築する実践演習を行っていただきます。
Taught by
Google Cloud Training