Google Cloud

Introducción a la ingeniería de datos en Google Cloud

En este curso, aprenderá sobre la ingeniería de datos en Google Cloud, las funciones y responsabilidades de los ingenieros de datos y cómo se relacionan con las ofertas de Google Cloud. También aprenderá cómo abordar los desafíos de la ingeniería de datos.

7 horas · Virtual
7 horas
Virtual

Comprender el rol de un ingeniero de datos. Identificar las tareas de ingeniería de datos y los componentes principales utilizados en Google Cloud. Comprender cómo crear e implementar canales de datos de distintos patrones en Google Cloud. Identificar y utilizar varias técnicas de automatización en Google Cloud.

Módulo 1: Tareas y componentes de ingeniería de datos. Explicar la función de un ingeniero de datos. Comprender las diferencias entre un origen y un receptor de datos. Explicar los diferentes tipos de formatos de datos. Explicar las opciones de la solución de almacenamiento en Google Cloud. Aprender sobre las opciones de administración de metadatos en Google Cloud. Entender cómo compartir conjuntos de datos fácilmente con Analytics Hub. Entender cómo cargar datos en BigQuery mediante la consola Google Cloud o la CLI de gCloud. Módulo 2: Replicación y migración de datos. Explicar la arquitectura base de replicación y migración de datos de Google Cloud. Comprender las opciones y los casos de uso de la herramienta de línea de comandos gCloud. Explicar la funcionalidad y los casos de uso del Servicio de transferencia de almacenamiento. Explicar la funcionalidad y los casos de uso del Dispositivo de transferencia. Comprender las características y la implementación de Datastream. Módulo 3: Extracción y carga de datos. Patrón de canalización: Explique el diagrama de la arquitectura de extracción y carga de línea base. Comprenda las opciones de la herramienta de línea de comandos bq. Explique la funcionalidad y los casos de uso del Servicio de transferencia de datos de BigQuery. Explique la funcionalidad y los casos de uso de BigLake como patrón sin extracción ni carga. Módulo 4: Patrón de canalización de extracción, carga y transformación de datos: Explique el diagrama de la arquitectura de extracción, carga y transformación de línea base. Comprenda una canalización ELT común en Google Cloud. Conozca las capacidades de scripting y programación de SQL de BigQuery. Explique la funcionalidad y los casos de uso de Dataform. Módulo 5: Patrón de canalización de extracción, transformación y carga de datos: Explique el diagrama de la arquitectura de extracción, transformación y carga de línea base. Conozca las herramientas de GUI en Google Cloud utilizadas para canalizaciones de datos ETL. Explique el procesamiento de datos por lotes con Dataproc. Aprenda a usar Dataproc Serverless para Spark para ETL. Explicar las opciones de procesamiento de datos de streaming. Explicar el papel que desempeña Bigtable en las canalizaciones de datos. Módulo 6: Técnicas de automatización. Explicar los patrones y opciones de automatización disponibles para las canalizaciones. Obtener información sobre el programador y los flujos de trabajo de Cloud. Obtener información sobre Cloud Composer. Obtener información sobre las funciones de ejecución de Cloud. Explicar la funcionalidad y los casos de uso de automatización para Eventarc.

Ingenieros de datosAdministradores de bases de datosAdministradores de sistemasRequisito previo:Experiencia previa en Google Cloud a nivel fundamental utilizando Cloud Shell y accediendo a productos desde la consola Google Cloud.Competencia básica con un lenguaje de consulta común como SQL.Experiencia con modelado de datos y actividades ETL (extracción, transformación, carga).Experiencia en el desarrollo de aplicaciones utilizando un lenguaje de programación común como Python.

Próximas Sesiones

Contáctanos para próximas fechas

Actualmente no hay sesiones programadas para este curso.

Solicitar Información