Inicio
Big Data Formación
Hadoop Formación
Hadoop para Desarrolladores (4 días)

Hadoop para Desarrolladores (4 días)

Apache Hadoop es el marco más popular para procesar Big Data en clústeres de servidores. Este curso introducirá a los desarrolladores a varios componentes del ecosistema Hadoop (HDFS, MapReduce, Pig, Hive y HBase).

Gracias por enviar su consulta! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.

Gracias por enviar su reserva! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.

Temario del curso

Sección 1: Introducción a Hadoop

Historia de Hadoop, conceptos
Ecosistema
Distribuciones
Arquitectura de alto nivel
Mitos de Hadoop
Desafíos de Hadoop
Hardware / software
Laboratorio: primera mirada a Hadoop

Sección 2: HDFS

Diseño y arquitectura
Conceptos (escalado horizontal, replicación, localidad de datos, conciencia del rack)
Demonios: Namenode, Secondary namenode, Data node
Comunicaciones / latidos de corazón
Integridad de los datos
Ruta de lectura / escritura
Namenode High Availability (HA), Federación
Laboratorio: Interacción con HDFS

Sección 3: MapReduce

Conceptos y arquitectura
Demonios (MRV1): jobtracker / tasktracker
Fases: driver, mapper, shuffle/sort, reducer
MapReduce Versión 1 y Versión 2 (YARN)
Internos de MapReduce
Introducción al programa Java MapReduce
Laboratorio: Ejecución de un programa de ejemplo de MapReduce

Sección 4: Pig

Pig vs Java MapReduce
Flujo del trabajo de Pig
Lenguaje Pig Latin
ETL con Pig
Transformaciones y uniones
Funciones definidas por el usuario (UDF)
Laboratorio: Escritura de scripts de Pig para analizar datos

Sección 5: Hive

Arquitectura y diseño
Tipos de datos
Soporte SQL en Hive
Creación y consulta de tablas de Hive
Particiones
Uniones
Procesamiento de texto
Laboratorio: Varios laboratorios sobre el procesamiento de datos con Hive

Sección 6: HBase

Conceptos y arquitectura
HBase vs RDBMS vs Cassandra
API Java de HBase
Datos de series temporales en HBase
Diseño de esquemas
Laboratorio: Interacción con HBase usando shell; Programación en la API Java de HBase; Ejercicio de diseño de esquema

Requerimientos

comodidad con el lenguaje de programación Java (la mayoría de los ejercicios de programación están en Java)
comodidad en un entorno Linux (ser capaz de navegar por la línea de comandos de Linux, editar archivos usando vi / nano)

Entorno de laboratorio

Instalación cero: ¡No es necesario instalar el software Hadoop en las máquinas de los estudiantes! Se proporcionará un clúster de Hadoop funcional para los estudiantes.

Los estudiantes necesitarán lo siguiente

un cliente SSH (Linux y Mac ya tienen clientes SSH, para Windows se recomienda Putty)
un navegador para acceder al clúster, Firefox recomendado

28 Horas

Número de participantes

En línea

Presencial

Seleccione el lugar

Seleccione un lugar

Precio por participante

Los cursos públicos requieren más de 5 participantes.

Hadoop para Desarrolladores (4 días) - Reserva

Nombre completo *

Correo electrónico *

Teléfono *

Título Profesional

Nombre de la Empresa

Dirección 1 *

Ciudad *

Estado / Provincia

País *

Código Postal *

Fecha de Inicio

Identificación Fiscal

Las fechas están sujetas a disponibilidad y tendrán lugar entre 09:30 y 16:30.

Pago *

Transferencia Bancaria (Factura, OC)

Débito / Tarjeta de Crédito

Comentarios

Términos y Condiciones *

Soy un representante autorizado del cliente arriba mencionado y deseo reservar los cursos o servicios arriba mencionados de acuerdo con los Términos y Condiciones y la Política de Privacidad de NobleProg.

Informarme sobre descuentos y promociones

Por favor, lea nuestra Política de Privacidad para saber cómo utilizamos sus datos

Hadoop para Desarrolladores (4 días) - Consulta

Nombre completo *

Correo electrónico *

Teléfono *

Número de participantes

Nombre de la Empresa

Dirección de la Compañía

¿Cómo quiere hacer el curso?

Instalaciones del Cliente

En línea

Presencial

Comentarios

Informarme sobre descuentos y promociones

Por favor, lea nuestra Política de Privacidad para saber cómo utilizamos sus datos

Hadoop para Desarrolladores (4 días) - Solicitud de consultoría

Nombre completo *

Teléfono *

Correo electrónico *

Nombre de la Empresa

Asunto de la consulta *

Consulta sobre el Objetivo

¿Con quién va a trabajar el consultor?

Consulta Urgente *

Comentarios

Informarme sobre descuentos y promociones

Por favor, lea nuestra Política de Privacidad para saber cómo utilizamos sus datos

Testimonios (1)

Ejercicios prácticos. La clase debería haber durado 5 días, pero los 3 días fueron útiles para aclarar muchas de las preguntas que tenía al trabajar con NiFi.

James - BHG Financial

Curso - Apache NiFi for Administrators

11275 USD (En línea)

13275 USD (Presencial)

Cursos Relacionados

Capacitación de Administrador para Apache Hadoop

35 Horas

Audiencia:

El curso está dirigido a especialistas en TI que buscan una solución para almacenar y procesar grandes conjuntos de datos en un entorno de sistema distribuido

Gol:

Conocimiento profundo sobre administración de clúster de Hadoop.

Análisis de Big Data en Salud

21 Horas

El análisis de big data implica el proceso de examinar grandes cantidades de conjuntos de datos variados para descubrir correlaciones, patrones ocultos y otros insights útiles.

La industria de la salud cuenta con enormes cantidades de datos médicos y clínicos complejos e heterogéneos. Aplicar técnicas de análisis de big data a los datos de salud presenta un gran potencial para derivar insights que mejoren la entrega de servicios de atención médica. Sin embargo, la inmensidad de estos conjuntos de datos plantea grandes desafíos en el análisis y las aplicaciones prácticas en un entorno clínico.

En este entrenamiento guiado por un instructor (remoto), los participantes aprenderán cómo realizar el análisis de big data en salud a través de una serie de ejercicios prácticos en vivo.

Al finalizar este entrenamiento, los participantes podrán:

Instalar y configurar herramientas de análisis de big data como Hadoop MapReduce y Spark
Comprender las características de los datos médicos
Aplicar técnicas de big data para manejar datos médicos
Estudiar sistemas y algoritmos de big data en el contexto de aplicaciones de salud

Audiencia

Desarrolladores
Científicos de Datos

Formato del Curso

Parte exposición, parte discusión, ejercicios y mucha práctica hands-on.

Nota

Para solicitar un entrenamiento personalizado para este curso, por favor contáctenos para arreglarlo.

Hadoop para administradores

21 Horas

Apache Hadoop es el marco de trabajo más popular para procesamiento Big Data en clusters de servidores. En este curso de tres (opcionalmente cuatro) días, los asistentes aprenderán sobre los beneficios comerciales y casos de uso para Hadoop y su ecosistema, cómo planificar la implementación y crecimiento del cluster, cómo instalar, mantener, monitorear, solucionar problemas y optimizar Hadoop. También practicarán el cargue masivo de datos en clusters, se familiarizarán con diversas distribuciones de Hadoop, y practicarán la instalación y administración de herramientas del ecosistema de Hadoop. El curso termina con una discusión sobre cómo asegurar el cluster mediante Kerberos.

“…Los materiales estaban muy bien preparados y cubrieron exhaustivamente. El Laboratorio fue muy útil y bien organizado”
— Andrew Nguyen, Ingeniero Principal de Integración DW, Microsoft Online Advertising

Audiencia

Administradores de Hadoop

Formato

Conferencias y laboratorios prácticos, aproximado equilibrio 60% conferencias, 40% laboratorio.

Hadoop Avanzado para Desarrolladores

21 Horas

Apache Hadoop es uno de los frameworks más populares para el procesamiento de Big Data en clústeres de servidores. Este curso se adentra en la gestión de datos en HDFS, Pig avanzado, Hive y HBase. Estas técnicas de programación avanzadas serán beneficiosas para desarrolladores experimentados en Hadoop.

Audiencia: desarrolladores

Duración: tres días

Formato: conferencias (50%) y laboratorios prácticos (50%).

Administración de Hadoop en MapR

28 Horas

Público objetivo:

Este curso está diseñado para desentrañar la tecnología de big data/hadoop y mostrar que no es difícil de entender.

Hadoop y Spark para Administradores

35 Horas

Esta capacitación en vivo dirigida por un instructor en Costa Rica (en línea o presencial) está dirigida a administradores de sistemas que desean aprender a configurar, implementar y administrar Hadoop clústeres dentro de su organización.

Al final de esta formación, los participantes serán capaces de:

Instale y configure Apache Hadoop.
Comprenda los cuatro componentes principales del ecosistema Hadoop: HDFS, MapReduce, YARN y Hadoop Common.
Utilice Hadoop Sistema de archivos distribuido (HDFS) para escalar un clúster a cientos o miles de nodos.
Configure HDFS para que funcione como motor de almacenamiento para implementaciones de Spark locales.
Configure Spark para acceder a soluciones de almacenamiento alternativas, como Amazon S3, y NoSQL sistemas de bases de datos como Redis, Elasticsearch, Couchbase, Aerospike, etc.
Lleve a cabo tareas administrativas como el aprovisionamiento, la gestión, la supervisión y la seguridad de un clúster Apache Hadoop.

HBase para Desarrolladores

21 Horas

Este curso introduce HBase - un almacén NoSQL en la parte superior de Hadoop. El curso está dirigido a desarrolladores que usarán HBase para desarrollar aplicaciones y administradores que administrarán los clústeres de HBase.

Vamos a recorrer un desarrollador a través de la arquitectura de HBase y modelado de datos y desarrollo de aplicaciones en HBase. También discutirá el uso de MapReduce con HBase y algunos temas de administración relacionados con la optimización del rendimiento. El curso es muy práctico con muchos ejercicios de laboratorio.

Apache NiFi para administradores

21 Horas

Apache NiFi (Hortonworks DataFlow) es una plataforma de procesamiento de eventos y logística de datos integrada en tiempo real que permite mover, rastrear y automatizar los datos entre los sistemas. Está escrito usando programación basada en flujo y proporciona una interfaz de usuario basada en web para administrar flujos de datos en tiempo real.

En esta capacitación en vivo dirigida por un instructor, los participantes aprenderán a implementar y administrar Apache NiFi en un entorno de laboratorio en vivo.

Al final de esta capacitación, los participantes podrán:

Instalar y configurar Apachi NiFi
Fuente, transformar y gestionar datos de fuentes de datos dispersas y distribuidas, incluidas bases de datos y lagos de datos grandes.
Automatice los flujos de datos
Habilitar análisis de transmisión
Aplicar varios enfoques para la ingestión de datos
Transformar Big Data y en conocimientos empresariales

Audiencia

Administradores del sistema
Ingenieros de datos
Desarrolladores
DevOps

Formato del curso

Conferencia de parte, discusión en parte, ejercicios y práctica práctica

Apache NiFi para desarrolladores

7 Horas

En esta capacitación en vivo dirigida por un instructor en Costa Rica, los participantes aprenderán los fundamentos de la programación basada en flujo a medida que desarrollan una serie de extensiones, componentes y procesadores de demostración utilizando Apache NiFi.

Al final de esta formación, los participantes serán capaces de:

Comprenda la arquitectura de NiFi y los conceptos de flujo de datos.
Desarrolle extensiones utilizando NiFi y API de terceros.
Desarrollar a medida su propio procesador Apache Nifi.
Ingiera y procese datos en tiempo real de formatos de archivo y fuentes de datos dispares y poco comunes.

Python, Spark y Hadoop para Big Data

21 Horas

Esta capacitación en vivo dirigida por un instructor en Costa Rica (en línea o presencial) está dirigida a desarrolladores que desean usar e integrar Spark, Hadoop y Python para procesar, analizar y transformar conjuntos de datos grandes y complejos.

Al final de esta formación, los participantes serán capaces de:

Configure el entorno necesario para empezar a procesar macrodatos con Spark, Hadoop y Python.
Comprender las características, los componentes principales y la arquitectura de Spark y Hadoop.
Aprenda a integrar Spark, Hadoop y Python para el procesamiento de big data.
Explore las herramientas del ecosistema de Spark (Spark MlLib, Spark Streaming, Kafka, Sqoop, Kafka y Flume).
Cree sistemas de recomendación de filtrado colaborativo similares a Netflix, YouTube, Amazon, Spotify y Google.
Utilice Apache Mahout para escalar los algoritmos de aprendizaje automático.

Hadoop para Desarrolladores (4 días)

Temario del curso

Sección 1: Introducción a Hadoop

Sección 2: HDFS

Sección 3: MapReduce

Sección 4: Pig

Sección 5: Hive

Sección 6: HBase

Requerimientos

Entorno de laboratorio

Testimonios (1)

James - BHG Financial

Curso - Apache NiFi for Administrators

Próximos cursos

Hadoop para Desarrolladores (4 días)

Hadoop para Desarrolladores (4 días)

Hadoop para Desarrolladores (4 días)

Hadoop para Desarrolladores (4 días)

Hadoop para Desarrolladores (4 días)

Categorías Relacionadas

Este sitio en otros países / regiones

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites