Contacta con nosotros

Temario del curso

Fundamentos de IA segura e justa

  • Conceptos clave: seguridad, sesgo, equidad, transparencia
  • Tipos de sesgo: datos, representación, algorítmico
  • Resumen de marcos regulatorios (Ley de IA de la UE, RGPD, etc.)

Sesgo en modelos ajustados finamente

  • Cómo el ajuste fino puede introducir o amplificar sesgos
  • Casos de estudio y fracasos en el mundo real
  • Identificación de sesgos en datos y predicciones de modelos

Técnicas de mitigación de sesgos

  • Estrategias a nivel de datos (rebalanceo, aumento)
  • Estrategias durante el entrenamiento (regularización, des sesgo adversarial)
  • Estrategias de postprocesamiento (filtrado de salida, calibración)

Seguridad y robustez del modelo

  • Detección de salidas inseguras o dañinas
  • Manejo de entradas adversarias
  • Pruebas de equipo rojo y estrés en modelos ajustados finamente

Auditoría y monitoreo de sistemas de IA

  • Métricas de evaluación de sesgo y equidad (por ejemplo, paridad demográfica)
  • Herramientas de explicabilidad y marcos de transparencia
  • Prácticas de monitoreo continuo y gobernanza

Paquetes de herramientas y práctica práctica

  • Uso de bibliotecas de código abierto (por ejemplo, Fairlearn, Transformers, CheckList)
  • Práctica: detección y mitigación de sesgos en un modelo ajustado finamente
  • Generación de salidas seguras mediante diseño de instrucciones y restricciones

Casos de uso empresarial y preparación para el cumplimiento

  • Mejores prácticas para integrar la seguridad en flujos de trabajo de LLM
  • Documentación y tarjetas de modelo para cumplimiento
  • Preparación para auditorías y revisiones externas

Resumen y próximos pasos

Requerimientos

  • Comprensión de modelos de aprendizaje automático y procesos de entrenamiento
  • Experiencia trabajando con ajuste fino y LLMs
  • Familiaridad con Python y conceptos de PLN

Público objetivo

  • Equipos de cumplimiento de IA
  • Ingenieros de ML
 14 Horas

Número de participantes


Precio por participante

Próximos cursos

Categorías Relacionadas