Cloudera

DOPS-244: Apache Kafka en Cloudera

Este curso presencial de cuatro días comienza con una introducción a Apache Kafka, explicando sus conceptos clave y arquitectura, y analizando varios casos de uso comunes. Partiendo de esta base, aprenderá a planificar una implementación de Kafka y, a continuación, adquirirá experiencia práctica instalando y configurando su propio clúster multinodo basado en Cloud que ejecuta Kafka en Cloudera. Posteriormente, utilizará este clúster durante más de 20 ejercicios prácticos que abarcan una variedad de habilidades esenciales, comenzando con la creación de temas, productores y consumidores de Kafka, y continuando con aspectos progresivamente más complejos de las operaciones y el desarrollo de Kafka, como los relacionados con la escalabilidad, la fiabilidad y los problemas de rendimiento. A lo largo del curso, aprenderá y utilizará las herramientas recomendadas por Cloudera para trabajar con Kafka, incluidos Cloudera Manager, Schema Registry, Streams Messaging Manager y Cruise Control.

28 horas · Virtual
28 horas
Virtual

Durante este curso, aprenderá a: Planificar, implementar y operar clústeres Kafka; Crear y administrar temas; Desarrollar productores y consumidores; Utilizar la replicación para mejorar la tolerancia a fallos; Utilizar el particionamiento para mejorar la escalabilidad; Solucionar problemas comunes y problemas de rendimiento.

Descripción general de afka Arquitectura de alto nivel Casos de uso comunes Distribución de Apache Cloudera Implementación de Apache Kafka Requisitos del sistema y dependencias Roles de servicio Planificación de la implementación Implementación de los servicios Kafka Ejercicio: Preparación del entorno del ejercicio Ejercicio: Instalación del servicio Kafka con el administrador Cloudera Ejercicio (opcional): Creación de paneles de métricas Ejercicio (opcional): Uso de la línea de comandos CM APIKafka Conceptos básicos de la línea de comandos Crear y administrar temas Ejecución de productores y consumidores Uso del administrador de mensajería de Streams (SMM) Descripción general del administrador de mensajería de Streams Productores, temas y consumidores Explorador de datos Agentes Administración de temas Ejercicio: Administración de temas mediante el CLIExercise: Conectar productores y consumidores desde la línea de comandosKafka Java API BasicsDescripción general de Kafka y APIsGestión de temas desde Java APIEjercicio (opcional): Gestionar temas de Kafka usando Java APIUso de productores y consumidores desde Java APIEjercicio: Desarrollar productores y consumidores con Java APIMejorar la disponibilidad mediante la replicaciónReplicationExercise: Observar el tiempo de inactividad debido a fallos del brokerConsideraciones para el factor de replicaciónExercise: Agregar réplicas para mejorar la disponibilidadMejorar la escalabilidad de la aplicaciónParticionamientoCómo se particionan los mensajesExercise: Observar cómo El particionamiento afecta al rendimientoGrupos de consumidoresEjercicio: Implementación de grupos de consumidoresReequilibrio de consumidoresEjercicio: Uso de una clave para controlar la asignación de particionesMejora de la fiabilidad de la aplicaciónSemántica de entregaDemostración (opcional): ISR frente a ACKEntrega del productorEjercicio: Productor idempotenteTransaccionesEjercicio: Productores y consumidores transaccionalesGestión de fallos del consumidorGestión de offsetsEjercicio: Detección y supresión de mensajes duplicadosEjercicio: Gestión de registros no válidosGestión de fallos del productorAnálisis de clústeres Kafka con SMMElentidad de extremo a extremoNotificadoresPolíticas de alertaCasos de usoSupervisión de KafkaDescripción general de la supervisiónSupervisión mediante Cloudera ManagerGráficos e informes en CMRecomendaciones de supervisiónMétricas para Solución de problemasDiagnóstico de fallas del servicioEjercicio: Monitoreo de KafkaAdministración de KafkaAdministración de Kafka Almacenamiento de temasDemostración (opcional): Período de retención de mensajesLimpieza y recopilación de registrosReequilibrio de particionesControl de cruceroEjercicio: Instalación de control de cruceroEjercicio: Solución de problemas de temas KafkaElección de líder no limpioEjercicio: Elección de líder no limpioAdición y eliminación de intermediariosEjercicio: Adición y eliminación de intermediariosMejores prácticasEstructura, formato y versionado de mensajesEstructura de mensajesRegistro de esquemasDefinición de esquemasEvolución y versionado de esquemasCliente de registro de esquemasEjercicio: Uso de un esquema AvroMejora del rendimiento de la aplicaciónTamaño del mensajeAgrupaciónCompresiónEjercicio: Observación de cómo la compresión afecta el rendimientoMejora del rendimiento del servicio KafkaAjuste del rendimiento Estrategias para el administradorEjercicio de dimensionamiento de clúster: Planificación de la capacidad necesaria para un caso de usoAseguramiento del clúster KafkaCifradoAutenticaciónAutorizaciónAuditoría

Este curso está diseñado para administradores de sistemas, ingenieros de datos y desarrolladores. Se espera que todos los estudiantes tengan experiencia básica con Linux y se recomienda un dominio básico del lenguaje de programación Java. No se requiere experiencia previa con Apache Kafka.

Próximas Sesiones

Contáctanos para próximas fechas

Actualmente no hay sesiones programadas para este curso.

Solicitar Información