Course | Puedata

Cloudera

Cloudera Capacitación para Apache HBase

Este curso permite a los participantes almacenar y acceder a grandes cantidades de datos multiestructurados y realizar cientos de miles de operaciones por segundo. Apache HBase es una base de datos distribuida, escalable y construida sobre Apache Hadoop. HBase puede almacenar datos en tablas masivas que constan de miles de millones de filas y millones de columnas, servir datos a muchos usuarios y aplicaciones en tiempo real y proporcionar acceso de lectura/escritura rápido y aleatorio a usuarios y aplicaciones.

21 horas · Virtual

21 horas

Virtual

Mediante sesiones prácticas e interactivas con ejercicios prácticos, el estudiante aprenderá: Los casos de uso y las ocasiones de uso de HBase, Hadoop y RDBMS. El uso del intérprete de comandos de HBase para manipular directamente las tablas de HBase. El diseño de esquemas óptimos de HBase para un almacenamiento y recuperación de datos eficientes. Cómo conectarse a HBase utilizando el token Java API para insertar y recuperar datos en tiempo real. Las mejores prácticas para identificar y resolver cuellos de botella de rendimiento.

Introducción a Hadoop y HBaseIntroducción a HadoopComponentes principales de Hadoop¿Qué es HBase?¿Por qué usar HBase?Fortalezas de HBaseHBase en producciónDebilidades de HBaseTablas de HBaseConceptos de HBaseFundamentos de las tablas de HBasePensando en el diseño de tablasLa consola de HBaseCreación de tablas con la consola de HBaseTrabajo con tablasTrabajo con datos de tablasFundamentos de la arquitectura de HBaseRegiones de HBaseArquitectura de clúster de HBaseHBase y localidad de datos de HDFSDiseño de esquemas de HBaseConsideraciones generales de diseñoDiseño centrado en la aplicaciónDiseño de claves de fila de HBaseOtras características de las tablas de HBaseAcceso básico a datos con HBase APIOpciones para acceder a los datos de HBaseCreación y eliminación de tablas de HBaseRecuperación de datos con GetRecuperación de datos con ScanInserción y actualización de datosEliminación de datosCaracterísticas más avanzadas de HBaseAPIFiltrado de escaneosMejores prácticasCoprocesadores de HBaseRuta de escritura de HBaseHBase Write RutasCompactaciónDivisionesRuta de lectura de HBaseCómo lee HBase los datosCachés de bloques para lecturaHBase en el clústerCómo usa HBase HDFSCompactaciones y divisionesOptimización del rendimiento de HBaseConsideraciones sobre la familia de columnasConsideraciones sobre el diseño del esquemaConfiguración para el almacenamiento en cachéConsideraciones sobre la memoriaGestión de series temporales y datos secuencialesRegiones de pre-divisiónAdministración de HBase y gestión de clústeresDaemons de HBaseConsideraciones sobre ZooKeeperAlta disponibilidad de HBaseUso del balanceador de HBaseCorrección de tablas con hbckSeguridad de HBaseReplicación y copia de seguridad de HBaseReplicación de HBaseCopia de seguridad de HBaseClústeres de MapReduce y HBaseUso de Hive e Impala con HBaseUso de Hive e Impala con HBaseConclusiónApéndice A: Acceso a datos con Python y ThriftUso de ThriftTrabajar con tablasObtención y almacenamiento de datosEscaneo de datosEliminación de datosContadoresFiltrosApéndice B: OpenTSDB

Este curso está dirigido a desarrolladores y administradores que deseen utilizar HBase. Se valorará la experiencia previa con bases de datos y modelado de datos, pero no es imprescindible. Se presupone conocimiento de Java. No se requiere conocimiento previo de Hadoop.

Próximas Sesiones

Contáctanos para próximas fechas

Actualmente no hay sesiones programadas para este curso.

Solicitar Información