Contacta con nosotros

Temario del curso

Introducción al ajuste fino de modelos de lenguaje grande de DeepSeek

  • Descripción general de los modelos DeepSeek, por ejemplo, DeepSeek-R1 y DeepSeek-V3
  • Comprensión de la necesidad de realizar ajustes finos en LLM
  • Comparación entre ajuste fino y diseño de instrucciones (prompt engineering)

Preparación del conjunto de datos para el ajuste fino

  • Selección de conjuntos de datos específicos de un dominio
  • Técnicas de preprocesamiento y limpieza de datos
  • Tokenización y formato de conjuntos de datos para el modelo de lenguaje grande DeepSeek

Configuración del entorno de ajuste fino

  • Configuración de aceleración con GPU y TPU
  • Configuración de Hugging Face Transformers con DeepSeek LLM
  • Comprensión de los hiperparámetros para el ajuste fino

Realización del ajuste fino del modelo de lenguaje grande DeepSeek

  • Implementación de ajuste fino supervisado
  • Uso de LoRA (Low-Rank Adaptation) y PEFT (Parameter-Efficient Fine-Tuning)
  • Ejecución de ajuste fino distribuido para conjuntos de datos a gran escala

Evaluación y optimización de los modelos con ajuste fino

  • Evaluación del rendimiento del modelo con métricas de evaluación
  • Manejo del sobreajuste (overfitting) y subajuste (underfitting)
  • Optimización de la velocidad de inferencia y la eficiencia del modelo

Implementación de modelos DeepSeek con ajuste fino

  • Empaquetado de modelos para implementación mediante API
  • Integración de modelos con ajuste fino en aplicaciones
  • Escalamiento de implementaciones con computación en la nube y en el edge

Casos de uso y aplicaciones del mundo real

  • LLM con ajuste fino para finanzas, atención médica y soporte al cliente
  • Estudios de casos de aplicaciones industriales
  • Consideraciones éticas en modelos de IA específicos de un dominio

Resumen y próximos pasos

Requerimientos

  • Experiencia con marcos de aprendizaje automático y aprendizaje profundo
  • Familiaridad con transformadores y modelos de lenguaje grande (LLM)
  • Conocimiento de técnicas de preprocesamiento de datos y entrenamiento de modelos

Público objetivo

  • Investigadores de IA que exploran el ajuste fino de LLM
  • Ingenieros de aprendizaje automático que desarrollan modelos de IA personalizados
  • Desarrolladores avanzados que implementan soluciones basadas en IA
 21 Horas

Número de participantes


Precio por participante

Próximos cursos

Categorías Relacionadas