Cloudera

ADMIN-280: Administrando Cloudera en Cloud

La capacitación para administradores de CDP Public Cloud proporciona a los participantes una comprensión integral de todos los pasos necesarios para configurar, operar y mantener instancias de CDP Public Cloud. Este curso, impartido por un instructor, abarca desde la configuración inicial hasta la configuración de diversos servicios de datos para ejecutar cargas de trabajo en Cloud en todos los principales proveedores de Cloud mediante la consola de administración Cloudera. También abarca diversas opciones de configuración mediante la interfaz web y escenarios de automatización con Ansible. En cuanto a la optimización, abarca el equilibrio de carga y el ajuste de instancias de CDP PC. Este curso de capacitación sobre Cloudera es la mejor preparación para los desafíos reales que enfrentan los administradores que ejecutan CDP Public Cloud.

28 horas · Virtual
28 horas
Virtual

A través de debates dirigidos por el instructor y ejercicios prácticos interactivos, aprenderá a: Evaluar y seleccionar la opción de implementación adecuada Configurar CDP Public Cloud mediante la consola de administración Cloudera Configurar y configurar varios servicios de datos Configurar y supervisar instancias mediante Cloudera Manager Optimizar el rendimiento y la seguridad del clúster Detectar, solucionar y reparar problemas con el clúster Escalar automáticamente los clústeres de Data Hub y los servicios de datos

Descripción general de la instalación (inicio rápido)Cloudera Consola de administraciónCredenciales CDPRegiones del plano de control de CDPRegistrar un entorno CDPCloudera Plataforma de datosTendencias de la industria para Big DataEl desafío de volverse impulsado por datosLos datos empresariales CloudDescripción general de CDPFactores de forma de CDPArquitectura de CDPDescripción generalConceptos clave y Componentes Resumen del entorno de ejecución de CDP Requisitos mínimos de hardware Conexiones salientes Resumen del plano de control Acceso y administración de un entorno Resumen de la administración de datos Consola de administración Panel de control Entornos Data Lakes Administración de usuarios Clústeres clásicos Concentradores de datos Catálogo de datos Administrador de replicación Observabilidad CLI de CDP (interfaz de línea de comandos) Interfaz de línea de comandos de la CLI de CDP Instalación de la CLI de CDP / Configuración del cliente de la CLI Módulos de la CLI Generación de una clave de acceso API / Configuración del cliente de CDP Inicio de sesión en la CLI/SDK de CDP Configuración de autocompletado de la CLI / Referencia de la CLI / Acceso a la ayuda de la CLI Resumen de API de CDP / Descripción general del SDK de CDP para Java / Descripción general de Curl de CDP Administración del acceso a CDP Consola de administración Administración de usuarios Crear usuario de máquina Permisos de usuario Sincronizar usuarios Configurar grupos Proveedores de identidad Roles y roles de recursos Configuración global Auditar credenciales de almacenamiento de datos Resumen de los concentradores de datos Planificación / Creación de su clúster de concentradores de datos Consideraciones generales de planificación Configuración de nodos Administración del concentrador de datos Elección El hardware adecuado. Configuración avanzada de clúster. Tipos de Data Hub: DataFlow, Ingeniería de datos. Solución de problemas. Administración de Data Hubs. Mejores prácticas en Data Hubs. Dimensionado de Data Hubs. Administrador de Cloudera. Servicios de Data Hub. Escalado automático / Información del Data Hub. Comprobación del estado del clúster / Eventos y alertas. Mantenimiento del host. Actualización de un clúster de Data Hub. Supervisión / Funciones de supervisión. Resumen de los servicios de datos. Planificación de su clúster de servicios de datos. Elección del hardware adecuado / Consideraciones de red. Creación de servicios de datos: DataFlow, Ingeniería de datos, Data Warehouse, Base de datos operativa, Machine Learning. Solución de problemas. DataFlow. Resumen del servicio DataFlow. Resumen de la ingesta de datos. Ingesta de datos mediante transferencia de archivos o interfaces REST. Ingesta de datos mediante NiFi. Escalado automático. Ingeniería de datos. Resumen del servicio de ingeniería de datos. Resumen de transmisiones de Apache Spark / Flink / Kafka. Escalado automático. Almacén de datos. Resumen del servicio de almacén de datos. Adición y administración de un catálogo de bases de datos. Adición y ajuste de una base de datos virtual. AlmacénConsulta a un almacén de datosVisualización de datosMonitoreo y Solución de problemas | Base de datos operativa | Resumen del servicio de base de datos operativa | Apache HBase/Resumen de búsqueda | Escalado automático | Machine Learning__ | Resumen del servicio TP2TOKEN78__ | Motores CML | Requisitos para espacios de trabajo CML | Aprovisionamiento de un espacio de trabajo CML | Escalado automático de CML | Monitoreo | Monitoreo y administración | Monitoreo y administración en CDP Public | Cloud | Monitoreo de clústeres de Data Lake y auditoría de CDP | Introducción al monitoreo en CDP | Monitoreo con Cloudera Manager: Pruebas de estado y paneles | Monitoreo de clústeres, servicios, hosts, roles y actividades | Solución de problemas de configuración y operación de clústeres | Administración de datos | SDX: seguridad y gobernanza | Conceptos de seguridad | Acceso | Cloud | Almacenamiento | Seguridad de Data Lake: SDX | Apache Ranger | Autorización/autenticación de CDP | Gobernanza de datos | Apache Atlas | Catálogo de datos | Observabilidad | Resumen de observabilidad | Soporte | Arquitectura de implementación de observabilidad | Capacidades de monitoreo | Trabajar con Alertas, costos e informes

Este curso es ideal para administradores y operadores de sistemas Cloud con al menos experiencia básica en Linux y AWS/Azure/GCP. No se requieren conocimientos previos de CDP ni de plataformas anteriores como CDH de Cloudera o Hortonworks HDP, pero serán útiles.

Próximas Sesiones