Class Central is learner-supported. When you buy through links on our site, we may earn an affiliate commission.

Google Cloud

Building Batch Data Pipelines on GCP em Português Brasileiro

Google Cloud and Google via Coursera

Overview

Os pipelines de dados geralmente se encaixam em um dos três paradigmas: extração-carregamento, extração-carregamento-transformação ou extração-transformação-carregamento. Este curso descreve qual paradigma deve ser usado em determinadas situações e quando isso ocorre com dados em lote. Além disso, vamos falar sobre várias tecnologias no Google Cloud para transformação de dados, incluindo o BigQuery, a execução do Spark no Dataproc, gráficos de pipeline no Cloud Data Fusion e processamento de dados sem servidor com o Dataflow. Os participantes vão ganhar experiência prática na criação de componentes de pipelines de dados no Google Cloud usando o Qwiklabs.

Syllabus

  • Introdução
    • Neste módulo, vamos apresentar o curso e a programação
  • Introdução à criação de pipelines de dados em lote
    • Este módulo analisa diferentes métodos de carregamento de dados: EL, ELT e ETL (e quando cada um deve ser usado)
  • Como executar o Spark no Dataproc
    • Este módulo mostra como executar o Hadoop no Dataproc, como usar o Cloud Storage e como otimizar os jobs do Dataproc.
  • Processamento de dados sem servidor com o Dataflow
    • Este módulo aborda o uso do Dataflow para criar pipelines de processamento de dados
  • Gerenciamento de pipelines de dados com
    • Este módulo mostra como gerenciar pipelines de dados com o Cloud Data Fusion e o Cloud Composer.
  • Resumo do curso
    • Resumo do curso

Taught by

Google Cloud Training

Reviews

4.7 rating at Coursera based on 15 ratings

Start your review of Building Batch Data Pipelines on GCP em Português Brasileiro

Never Stop Learning.

Get personalized course recommendations, track subjects and courses with reminders, and more.

Someone learning on their laptop while sitting on the floor.