Contacta con nosotros

Temario del curso

Introducción a Apache Iceberg

  • Visión general de Apache Iceberg
  • Repaso de conceptos básicos

Análisis detallado de la arquitectura de Iceberg

  • Análisis en profundidad del formato de tabla de Iceberg
  • Visión general detallada de la arquitectura, incluidos los metadatos y la disposición de archivos
  • Aspectos internos de la evolución del esquema y la partición

Instalación y configuración avanzada

  • Configuración de Iceberg para un rendimiento óptimo en diferentes entornos
  • Integración con varios motores de procesamiento de datos
  • Configuración avanzada: seguridad, cifrado y controles de acceso
  • Configuración de Iceberg en un entorno distribuido

Operaciones y mantenimiento avanzados

  • Gestión de tablas Iceberg a gran escala
  • Implementación y gestión de cambios complejos de esquema
  • Gestión de la evolución de las particiones y el particionado oculto
  • Operaciones CRUD avanzadas con cambios de esquema y partición

Técnicas de optimización de consultas

  • Técnicas para reducir la latencia de las consultas
  • Poda de particiones y poda de archivos
  • Caché de metadatos y estrategias de optimización
  • Implementación y prueba de técnicas de optimización de consultas

Ajuste de rendimiento para conjuntos de datos grandes

  • Optimización del rendimiento para conjuntos de datos a gran escala
  • Uso de las características integradas de Iceberg para el ajuste de rendimiento
  • Estudios de casos sobre el ajuste de rendimiento en escenarios del mundo real
  • Ajuste de rendimiento para conjuntos de datos a gran escala

Migración e integración de datos avanzada

  • Migración de estructuras de datos complejas desde otros sistemas
  • Integración de Iceberg con flujos de datos en tiempo real
  • Migración de conjuntos de datos complejos e integración de flujos de datos en tiempo real

Fiabilidad y consistencia

  • Garantía de la consistencia e integridad de los datos en entornos distribuidos
  • Implementación y gestión de garantías transaccionales
  • Gestión de fallos y mecanismos de recuperación
  • Implementación de características de fiabilidad y consistencia

Funcionalidades avanzadas y personalización

  • Implementaciones de catálogos personalizados
  • Ampliación de Iceberg con funcionalidades personalizadas
  • Implementación de catálogos personalizados y extensión de las funcionalidades de Iceberg

Gobernanza de datos y cumplimiento normativo

  • Implementación de políticas de gobernanza de datos
  • Cumplimiento de las normativas de datos
  • Gestión de registros de auditoría y linaje de datos
  • Implementación de características de gobernanza y cumplimiento normativo

Resumen y próximos pasos

Requerimientos

  • Familiaridad con los conceptos básicos, operaciones fundamentales y gestión de tablas de Iceberg

Público objetivo

  • Ingenieros de datos
  • Arquitectos de datos
  • Analistas de datos
  • Desarrolladores de software
 21 Horas

Número de participantes


Precio por participante

Testimonios (1)

Próximos cursos

Categorías Relacionadas