Temario del curso
Arquitectura de Greenplum
- Procesamiento paralelo y multiprocesamiento simétrico
- Roles de segmento y configuración del clúster
- Escalabilidad y movimiento de datos
- Arquitectura del almacén de datos de Greenplum
Estructuras de tablas de Greenplum
- Tablas distribuidas frente a tablas de asignación aleatoria
- Tablas tipo heap frente a tablas de solo append (append-only)
- Formatos de almacenamiento por fila frente a almacenamiento columnar
- Tablas particionadas y agrupadas (clustered)
Distribución de datos y hash
- Lógica de hash y claves de distribución
- Manejo de asimetrías (skew) y su impacto en el rendimiento
- Mapas de hash y estrategias de ubicación de filas
Índices y optimización del rendimiento
- Índices agrupados (clustered) y no agrupados
- Casos de uso de índices B-tree y bitmap
- Comportamiento de los escaneos de índices y del almacenamiento
Diseño físico de la base de datos
- Normalización y diseño del modelo lógico
- Estrategias de acceso del usuario y análisis de distribución
- Demografía de datos y decisiones de indexación
Técnicas de desnormalización
- Datos derivados, tablas resumen y pre-join
- Tablas columnares como particionamiento vertical
- Data marts y vistas materializadas
SQL avanzado y ejecución de consultas
- Estrategias de join y redistribución
- Funciones OLAP y de ventana
- Tablas temporales, subconsultas y tablas derivadas
Planes EXPLAIN y ajuste de consultas
- Lectura e interpretación de la salida EXPLAIN
- Análisis de costos y optimización de planes
- Movimiento de joins y operaciones locales a segmentos
Utilidades de Greenplum y mejores prácticas
- ANALYZE y VACUUM
- Carga y movimiento de datos con Nexus
- Seguridad, permisos y consejos de rendimiento
Resumen y próximos pasos
Requerimientos
- Comprensión de bases de datos relacionales y SQL
- Experiencia con almacenes de datos o sistemas analíticos
- Familiaridad con el uso de la línea de comandos de Linux
Público objetivo
- Arquitectos e ingenieros de datos
- Administradores de bases de datos y líderes técnicos
- Desarrolladores de BI y especialistas en análisis que trabajan con Greenplum
Testimonios (5)
los ejercicios y la resolucion de problemas
Mario Humberto Serrano Gutierrez - Hipodromo de Agua Caliente
Curso - Greenplum Architecture and Data Modeling
La teoria fue lo mas interesante
Luis Antonio Jimenez Gil - Hipodromo de Agua Caliente
Curso - Greenplum Architecture and Data Modeling
los ejercicios practicos y la disposicion para contestar las preguntas
Edith Vichua Solis - Hipodromo de Agua Caliente
Curso - Greenplum Architecture and Data Modeling
la explicacion, creo que uso terminos quee para todos fue demasiado entendible
Moises Jafet Hernandez Fuentes - Hipodromo de Agua Caliente
Curso - Greenplum Architecture and Data Modeling
las prácticas
Liliana Padilla - Hipodromo de Agua Caliente
Curso - Greenplum Architecture and Data Modeling
Traducción Automática