Contacta con nosotros

Temario del curso

Introducción a los Modelos Visión-Lenguaje

  • Visión general de los VLMs y su papel en la IA multimodal.
  • Arquitecturas populares: CLIP, Flamingo, BLIP, etc.
  • Casos de uso: búsqueda, generación de descripciones, sistemas autónomos, análisis de contenido.

Preparación del Entorno para el Ajuste Fino

  • Configuración de OpenCLIP y otras bibliotecas de VLMs.
  • Formatos de datos para pares de imagen-texto.
  • Pipelines de procesamiento previo para entradas de visión y lenguaje.

Ajuste Fino de CLIP y Modelos Similares

  • Contrastive loss y espacios de incrustación conjunta.
  • Práctica: ajuste fino de CLIP en conjuntos de datos personalizados.
  • Manejo de datos específicos del dominio y multilingües.

Técnicas Avanzadas de Ajuste Fino

  • Uso de LoRA y métodos basados en adaptadores para mayor eficiencia.
  • Ajuste de prompts e inyección visual de prompts.
  • Compensaciones entre la evaluación cero (zero-shot) y el ajuste fino.

Evaluación y Puntuación

  • Métricas para VLMs: precisión de recuperación, BLEU, CIDEr, recall.
  • Diagnósticos de alineación texto-imagen.
  • Visualización de espacios de incrustación y clasificaciones erróneas.

Implementación y Uso en Aplicaciones Reales

  • Exportación de modelos para inferencia (TorchScript, ONNX).
  • Integración de VLMs en pipelines o APIs.
  • Consideraciones de recursos y escalado de modelos.

Casos de Estudio y Escenarios Aplicados

  • Análisis de medios y moderación de contenido.
  • Búsqueda y recuperación en comercio electrónico y bibliotecas digitales.
  • Interacción multimodal en robótica y sistemas autónomos.

Resumen y Próximos Pasos

Requerimientos

  • Comprensión del aprendizaje profundo para visión por computadora y PLN (Procesamiento de Lenguaje Natural).
  • Experiencia con PyTorch y modelos basados en transformadores.
  • Conocimiento de arquitecturas de modelos multimodales.

Público Objetivo

  • Ingenieros de visión por computadora.
  • Desarrolladores de IA.
 14 Horas

Número de participantes


Precio por participante

Próximos cursos

Categorías Relacionadas