Contacta con nosotros

Temario del curso

Introducción a la multimodalidad de Gemini 3

  • Capacidades en texto, imágenes, audio y vídeo
  • Selección del modelo y visión general de los puntos finales
  • Conceptos clave en el razonamiento multimodal

Trabajo con texto y entradas estructuradas

  • Estrategias de prompts para la generación de texto
  • Metadatos, ventanas de contexto y embeddings
  • Orquestación de tareas multimodales basada en texto

Comprensión de imágenes y flujos de trabajo visuales

  • Análisis e interpretación de imágenes con Gemini 3
  • Creación de herramientas de búsqueda visual y etiquetado
  • Desarrollo de interacciones de imagen a texto y de texto a imagen

Procesamiento de entradas de audio

  • Flujos de trabajo de reconocimiento y transcripción de voz
  • Detección e interpretación de eventos de audio
  • Integración del audio con entradas de texto y visuales

Inteligencia de vídeo y análisis de escenas

  • Razonamiento continuo y fotograma a fotograma en vídeo
  • Creación de herramientas de resumen y extracción de momentos destacados
  • Automatización y flujos de trabajo basados en vídeo

Diseño de arquitecturas de aplicaciones multimodales

  • Combinación de múltiples tipos de entrada en un único pipeline
  • Consideraciones sobre latencia, coste y capacidad computacional
  • Mejores prácticas para sistemas multimodales escalables

Prototipado de aplicaciones multimodales

  • Creación práctica de prototipos multimodales
  • Iteración rápida mediante ingeniería de prompts
  • Pruebas y refinamiento de los flujos de experiencia de usuario

Implementación de soluciones multimodales

  • Estrategias de implementación y configuración del entorno
  • Monitorización del rendimiento en entornos reales
  • Consideraciones de seguridad y cumplimiento normativo

Resumen y próximos pasos

Requerimientos

  • Comprender los conceptos modernos de inteligencia artificial
  • Experiencia con Python o JavaScript
  • Conocimiento de las API REST

Público objetivo

  • Diseñadores
  • Creadores de contenido
  • Equipos técnicos de producto
 14 Horas

Número de participantes


Precio por participante

Testimonios (1)

Próximos cursos

Categorías Relacionadas