Gracias por enviar su consulta! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.
Gracias por enviar su reserva! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.
Temario del curso
Introducción al ajuste fino de modelos de lenguaje grande de DeepSeek
- Descripción general de los modelos DeepSeek, por ejemplo, DeepSeek-R1 y DeepSeek-V3
- Comprensión de la necesidad de realizar ajustes finos en LLM
- Comparación entre ajuste fino y diseño de instrucciones (prompt engineering)
Preparación del conjunto de datos para el ajuste fino
- Selección de conjuntos de datos específicos de un dominio
- Técnicas de preprocesamiento y limpieza de datos
- Tokenización y formato de conjuntos de datos para el modelo de lenguaje grande DeepSeek
Configuración del entorno de ajuste fino
- Configuración de aceleración con GPU y TPU
- Configuración de Hugging Face Transformers con DeepSeek LLM
- Comprensión de los hiperparámetros para el ajuste fino
Realización del ajuste fino del modelo de lenguaje grande DeepSeek
- Implementación de ajuste fino supervisado
- Uso de LoRA (Low-Rank Adaptation) y PEFT (Parameter-Efficient Fine-Tuning)
- Ejecución de ajuste fino distribuido para conjuntos de datos a gran escala
Evaluación y optimización de los modelos con ajuste fino
- Evaluación del rendimiento del modelo con métricas de evaluación
- Manejo del sobreajuste (overfitting) y subajuste (underfitting)
- Optimización de la velocidad de inferencia y la eficiencia del modelo
Implementación de modelos DeepSeek con ajuste fino
- Empaquetado de modelos para implementación mediante API
- Integración de modelos con ajuste fino en aplicaciones
- Escalamiento de implementaciones con computación en la nube y en el edge
Casos de uso y aplicaciones del mundo real
- LLM con ajuste fino para finanzas, atención médica y soporte al cliente
- Estudios de casos de aplicaciones industriales
- Consideraciones éticas en modelos de IA específicos de un dominio
Resumen y próximos pasos
Requerimientos
- Experiencia con marcos de aprendizaje automático y aprendizaje profundo
- Familiaridad con transformadores y modelos de lenguaje grande (LLM)
- Conocimiento de técnicas de preprocesamiento de datos y entrenamiento de modelos
Público objetivo
- Investigadores de IA que exploran el ajuste fino de LLM
- Ingenieros de aprendizaje automático que desarrollan modelos de IA personalizados
- Desarrolladores avanzados que implementan soluciones basadas en IA
21 Horas