Cloudera

Cloudera Capacitación para Apache HBase

Este curso permite a los participantes almacenar y acceder a cantidades masivas de datos multiestructurados y realizar cientos de miles de operaciones por segundo. Apache HBase es una base de datos distribuida, escalable y sin tokens (NoSQL), basada en Apache Hadoop. HBase puede almacenar datos en tablas masivas con miles de millones de filas y millones de columnas, proporcionar datos a numerosos usuarios y aplicaciones en tiempo real y proporcionar acceso rápido y aleatorio de lectura/escritura a usuarios y aplicaciones.

21 horas · Virtual
21 horas
Virtual

A través de sesiones prácticas e interactivas con ejercicios prácticos, el estudiante aprenderá: Los casos de uso y las ocasiones de uso de HBase, Hadoop y RDBMS. Usar el shell de HBase para manipular directamente las tablas de HBase. Diseñar esquemas HBase óptimos para un almacenamiento y recuperación de datos eficientes. Cómo conectarse a HBase usando Java API para insertar y recuperar datos en tiempo real. Mejores prácticas para identificar y resolver cuellos de botella de rendimiento.

Introducción a Hadoop y HBase Introducción a Hadoop Componentes principales de Hadoop ¿Qué es HBase? ¿Por qué usar HBase? Fortalezas de HBase HBase en producción Debilidades de HBase Tablas de HBase Conceptos de HBase Fundamentos de las tablas de HBase Reflexiones sobre el diseño de tablas El shell de HBase Creación de tablas con el shell de HBase Trabajo con tablas Trabajo con datos de tablas Fundamentos de la arquitectura de HBase Regiones de HBase Arquitectura de clústeres de HBase Localidad de datos de HBase y HDFS Diseño del esquema de HBase Consideraciones generales de diseño Diseño centrado en la aplicación Diseño de claves de fila de HBase Otras funciones de las tablas de HBase Acceso básico a datos con HBase Opciones para acceder a los datos de HBase Creación y eliminación de tablas de HBase Recuperación de datos con Get Recuperación de datos con Scan Inserción y actualización de datos Eliminación de datos Funciones más avanzadas de HBase Filtrado de escaneos Recomendaciones Coprocesadores de HBase Ruta de escritura de HBase Escritura de HBase Compactación de rutas, Divisiones, Ruta de lectura de HBase, Cómo HBase lee las cachés de bloques de datos para leer HBase en el clúster, Cómo HBase usa HDFS, Compactaciones y divisiones, Ajuste del rendimiento de HBase, Consideraciones sobre la familia de columnas, Consideraciones sobre el diseño de esquemas, Configuración para el almacenamiento en caché, Consideraciones sobre la memoria, Manejo de series temporales y datos secuenciales, Regiones previas a la división, Administración de HBase y gestión de clústeres, Daemons de HBase, Consideraciones sobre ZooKeeper, Alta disponibilidad de HBase, Uso del balanceador de HBase, Corrección de tablas con hbck, Seguridad de HBase, Replicación y copia de seguridad de HBase, Replicación de HBase, Copia de seguridad de HBase, MapReduce y clústeres de HBase, Uso de Hive e Impala con HBase, Uso de Hive e Impala con HBase, Conclusión, Apéndice A: Acceso a datos con Python y Thrift, Uso de Thrift, Trabajo con tablas, Obtención e inserción de datos, Escaneo de datos, Eliminación de datos, Contadores, Filtros, Apéndice B: OpenTSDB

Este curso es adecuado para desarrolladores y administradores que deseen utilizar HBase. Se valora la experiencia previa con bases de datos y modelado de datos, pero no es imprescindible. Se asumen conocimientos de Java. No se requieren conocimientos de Hadoop.

Próximas Sesiones

Contáctanos para próximas fechas

Actualmente no hay sesiones programadas para este curso.

Solicitar Información