Contacta con nosotros

Temario del curso

Arquitectura de Greenplum

  • Procesamiento paralelo y multiprocesamiento simétrico
  • Roles de segmento y configuración del clúster
  • Escalabilidad y movimiento de datos
  • Arquitectura del almacén de datos de Greenplum

Estructuras de tablas de Greenplum

  • Tablas distribuidas frente a tablas de asignación aleatoria
  • Tablas tipo heap frente a tablas de solo append (append-only)
  • Formatos de almacenamiento por fila frente a almacenamiento columnar
  • Tablas particionadas y agrupadas (clustered)

Distribución de datos y hash

  • Lógica de hash y claves de distribución
  • Manejo de asimetrías (skew) y su impacto en el rendimiento
  • Mapas de hash y estrategias de ubicación de filas

Índices y optimización del rendimiento

  • Índices agrupados (clustered) y no agrupados
  • Casos de uso de índices B-tree y bitmap
  • Comportamiento de los escaneos de índices y del almacenamiento

Diseño físico de la base de datos

  • Normalización y diseño del modelo lógico
  • Estrategias de acceso del usuario y análisis de distribución
  • Demografía de datos y decisiones de indexación

Técnicas de desnormalización

  • Datos derivados, tablas resumen y pre-join
  • Tablas columnares como particionamiento vertical
  • Data marts y vistas materializadas

SQL avanzado y ejecución de consultas

  • Estrategias de join y redistribución
  • Funciones OLAP y de ventana
  • Tablas temporales, subconsultas y tablas derivadas

Planes EXPLAIN y ajuste de consultas

  • Lectura e interpretación de la salida EXPLAIN
  • Análisis de costos y optimización de planes
  • Movimiento de joins y operaciones locales a segmentos

Utilidades de Greenplum y mejores prácticas

  • ANALYZE y VACUUM
  • Carga y movimiento de datos con Nexus
  • Seguridad, permisos y consejos de rendimiento

Resumen y próximos pasos

Requerimientos

  • Comprensión de bases de datos relacionales y SQL
  • Experiencia con almacenes de datos o sistemas analíticos
  • Familiaridad con el uso de la línea de comandos de Linux

Público objetivo

  • Arquitectos e ingenieros de datos
  • Administradores de bases de datos y líderes técnicos
  • Desarrolladores de BI y especialistas en análisis que trabajan con Greenplum
 21 Horas

Número de participantes


Precio por participante

Testimonios (5)

Próximos cursos

Categorías Relacionadas