Google Cloud

Introducción a la ingeniería de datos en Google Cloud

En este curso, aprenderá sobre ingeniería de datos en Google Cloud, las funciones y responsabilidades de los ingenieros de datos y cómo se relacionan con las ofertas de Google Cloud. También aprenderá a abordar los desafíos de la ingeniería de datos.

7 horas · Virtual
7 horas
Virtual

Comprender el rol de un ingeniero de datos. Identificar las tareas de ingeniería de datos y los componentes principales utilizados en Google Cloud. Comprender cómo crear e implementar flujos de datos de diferentes patrones en Google Cloud. Identificar y utilizar diversas técnicas de automatización en Google Cloud.

Módulo 1: Tareas y componentes de ingeniería de datos. Explicar el rol de un ingeniero de datos. Comprender las diferencias entre una fuente de datos y un destino de datos. Explicar los diferentes tipos de formatos de datos. Explicar las opciones de solución de almacenamiento en Google Cloud. Aprender sobre las opciones de administración de metadatos en Google Cloud. Comprender cómo compartir conjuntos de datos fácilmente usando Analytics Hub. Comprender cómo cargar datos en BigQuery usando la consola Google Cloud o la CLI gCloud. Módulo 2: Replicación y migración de datos. Explicar la arquitectura básica de replicación y migración de datos de Google Cloud. Comprender las opciones y los casos de uso de la herramienta de línea de comandos gCloud. Explicar la funcionalidad y los casos de uso de Storage Transfer Service. Explicar la funcionalidad y los casos de uso de Transfer Appliance. Comprender las características y la implementación de Datastream. Módulo 3: Extracción y carga de datos. Patrón de canalizaciónExplicar el diagrama de arquitectura de extracción y carga de referencia.Comprender las opciones de la herramienta de línea de comandos bq.Explicar la funcionalidad y los casos de uso del servicio de transferencia de datos de BigQuery.Explicar la funcionalidad y los casos de uso de BigLake como un patrón que no es de extracción y carga.Módulo 4: Patrón de canalización de datos de extracción, carga y transformaciónExplicar el diagrama de arquitectura de extracción, carga y transformación de referencia.Comprender una canalización ELT común en Google Cloud.Aprender sobre las capacidades de scripting y programación de BigQuery SQL.Explicar la funcionalidad y los casos de uso de Dataform.Módulo 5: Patrón de canalización de datos de extracción, transformación y cargaExplicar el diagrama de arquitectura de extracción, transformación y carga de referencia.Aprender sobre las herramientas GUI en Google Cloud utilizadas para las canalizaciones de datos ETL.Explicar el procesamiento de datos por lotes con Dataproc.Aprender a usar Dataproc Serverless para Spark para ETL.Explicar las opciones de procesamiento de datos en tiempo real.Explicar el papel que desempeña Bigtable en las canalizaciones de datos.Módulo 6: Técnicas de automatizaciónExplicar los patrones y opciones de automatización disponibles para las canalizaciones.Aprender sobre el programador y los flujos de trabajo.Aprender sobre el compositor.Aprender sobre las funciones de ejecución.Explicar la funcionalidad y los casos de uso de automatización para Eventarc.

Ingenieros de datosAdministradores de bases de datosAdministradores de sistemasRequisito previo:Experiencia previa en el nivel fundamental utilizando la consola y accediendo a productos desde la consola.Competencia básica con un lenguaje de consulta común como .Experiencia con modelado de datos y actividades ETL (extracción, transformación, carga).Experiencia en el desarrollo de aplicaciones utilizando un lenguaje de programación común como Python.

Próximas Sesiones

Contáctanos para próximas fechas

Actualmente no hay sesiones programadas para este curso.

Solicitar Información