Contacta con nosotros

Temario del curso

Introducción a los Modelos de Lenguaje Grande (LLM)

  • Visión general de los LLM
  • Definición e importancia
  • Aplicaciones en la IA actual

Arquitectura del transformador

  • ¿Qué es un transformador y cómo funciona?
  • Componentes y características principales
  • Aprendizaje por embedding y codificación posicional
  • Atención de múltiples cabezas
  • Red neuronal de alimentación directa
  • Normalización y conexiones residuales

Modelos transformadores

  • Mecanismo de autoatención
  • Arquitectura de codificador-decodificador
  • Embeddings posicionales
  • BERT (Representaciones Codificadoras Bidireccionales de los Transformadores)
  • GPT (Transformador Generativo Preentrenado)

Optimización del rendimiento y riesgos

  • Longitud del contexto
  • Mamba y modelos de espacio de estado
  • Atención flash
  • Transformadores dispersos
  • Transformadores de visión
  • Importancia de la cuantización

Mejora de los transformadores

  • Generación de texto aumentada por recuperación
  • Mezcla de modelos
  • Árbol de pensamientos

Ajuste fino (Fine-Tuning)

  • Teoría de la adaptación de bajo rango
  • Ajuste fino con QLora

Leyes de escalado y optimización en los LLM

  • Importancia de las leyes de escalado para los LLM
  • Escalado del tamaño de los datos y del modelo
  • Escalado computacional
  • Escalado de la eficiencia de los parámetros

Optimización

  • Relación entre el tamaño del modelo, el tamaño de los datos, el presupuesto de cómputo y los requisitos de inferencia
  • Optimización del rendimiento y la eficiencia de los LLM
  • Mejores prácticas y herramientas para entrenar y ajustar finamente los LLM

Entrenamiento y ajuste fino de LLM

  • Etapas y desafíos del entrenamiento de LLM desde cero
  • Adquisición y mantenimiento de datos
  • Requisitos de datos a gran escala, CPU y memoria
  • Desafíos de optimización
  • Panorama de los LLM de código abierto

Fundamentos del Aprendizaje por Refuerzo (RL)

  • Introducción al aprendizaje por refuerzo
  • Aprendizaje mediante refuerzo positivo
  • Definición y conceptos clave
  • Proceso de decisión de Markov (MDP)
  • Programación dinámica
  • Métodos de Monte Carlo
  • Aprendizaje por diferencia temporal

Aprendizaje por refuerzo profundo

  • Redes Q profundas (DQN)
  • Optimización por política proximal (PPO)
  • Elementos del aprendizaje por refuerzo

Integración de LLM y aprendizaje por refuerzo

  • Combinación de LLM con aprendizaje por refuerzo
  • Cómo se utiliza el RL en los LLM
  • Aprendizaje por refuerzo con retroalimentación humana (RLHF)
  • Alternativas al RLHF

Casos de estudio y aplicaciones

  • Aplicaciones del mundo real
  • Historias de éxito y desafíos

Tópicos avanzados

  • Técnicas avanzadas
  • Métodos avanzados de optimización
  • Investigación y desarrollos de vanguardia

Resumen y próximos pasos

Requerimientos

  • Conocimientos básicos de aprendizaje automático

Público objetivo

  • Científicos de datos
  • Ingenieros de software
 21 Horas

Número de participantes


Precio por participante

Próximos cursos

Categorías Relacionadas