Implementación de Tencent Hunyuan en Entorno de Producción: Inferencia de Baja Latencia y Optimización de Costos
Implementación de Tencent Hunyuan en Entorno de Producción: Inferencia de Baja Latencia y Optimización de Costos es un curso práctico sobre cómo servir modelos de Tencent Hunyuan de manera confiable y a gran escala.
Esta formación en vivo dirigida por un instructor (en línea o presencial) está dirigida a ingenieros y arquitectos de nivel intermedio que deseen utilizar Tencent Hunyuan para desplegar modelos grandes y MoE con menor latencia, mejor utilización de GPU y costos operativos controlados.
Al finalizar esta formación, los participantes serán capaces de:
- explicar los principales desafíos de producción al servir modelos de Tencent Hunyuan.
- aplicar técnicas prácticas de optimización de inferencia, como TensorRT, ajuste del KV-cache, cuantización y agrupación (batching).
- diseñar un enfoque de implementación escalable con escalado automático, monitoreo y planificación de capacidad.
- mejorar el equilibrio entre latencia y costos para cargas de trabajo reales en producción.
Formato del Curso
- Conferencia interactiva y discusión.
- Numerosos ejercicios y práctica.
- Implementación práctica en un entorno de laboratorio en vivo.
Opciones de Personalización del Curso
- Para solicitar una formación personalizada para este curso, contáctenos para organizarla.
Temario del curso
Fundamentos de Tencent Hunyuan para Producción
- Descripción general de los escenarios de servicio de modelos Tencent Hunyuan.
- Características de producción de modelos grandes y MoE.
- Principales cuellos de botella de latencia, capacidad de procesamiento y costos.
- Definición de objetivos de nivel de servicio (SLO) para cargas de trabajo de inferencia.
Arquitectura de Despliegue y Flujo de Servicio
- Componentes principales de una pila de inferencia en producción.
- Elección entre modelos de despliegue contenerizado, local (on-premise) y en la nube.
- Carga de modelos, enrutamiento de solicitudes y asignación de GPU básicos.
- Diseño para confiabilidad y simplicidad operativa.
Optimización de Latencia en la Práctica
- Uso de motores de inferencia optimizados como TensorRT, cuando sea aplicable.
- Conceptos del KV-cache y ajuste práctico del caché.
- Reducción de la sobrecarga de inicio, calentamiento (warmup) y respuesta.
- Medición del tiempo hasta el primer token y la velocidad de generación de tokens.
Capacidad de Procesamiento, Agrupación (Batching) y Eficiencia de GPU
- Estrategias de agrupación continua y de solicitudes.
- Gestión de la concurrencia y el comportamiento de las colas.
- Mejora de la utilización de GPU sin afectar la experiencia del usuario.
- Manejo de solicitudes de contexto largo y cargas de trabajo mixtas.
Cuantización y Control de Costos
- Por qué la cuantización es importante para el servicio en producción.
- Compromisos prácticos de FP16, INT8 y otras opciones de precisión comunes.
- Equilibrio entre la calidad del modelo, la latencia y el costo de infraestructura.
- Creación de una lista de verificación simple para la optimización de costos.
Operaciones, Monitoreo y Revisión de Preparación
- Disparadores para el escalado automático de servicios de inferencia.
- Monitoreo de latencia, capacidad de procesamiento, uso de caché y estado de la GPU.
- Aspectos básicos de registro de eventos, alertas y respuesta a incidentes.
- Revisión de una implementación de referencia y creación de un plan de mejora.
Requerimientos
- Comprensión básica de los flujos de trabajo de despliegue e inferencia de modelos de lenguaje grandes.
- Experiencia con contenedores, infraestructura en la nube o local (on-premise) y servicios basados en API.
- Conocimiento práctico de Python o tareas de ingeniería de sistemas.
Público Objetivo
- Ingenieros de ML que despliegan LLMs en producción.
- Ingenieros de plataforma responsables de servicios de inferencia basados en GPU.
- Arquitectos de soluciones que diseñan plataformas de servicio de IA escalables.
Los cursos públicos requieren más de 5 participantes.
Implementación de Tencent Hunyuan en Entorno de Producción: Inferencia de Baja Latencia y Optimización de Costos - Reserva
Implementación de Tencent Hunyuan en Entorno de Producción: Inferencia de Baja Latencia y Optimización de Costos - Consulta
Implementación de Tencent Hunyuan en Entorno de Producción: Inferencia de Baja Latencia y Optimización de Costos - Solicitud de consultoría
Próximos cursos
Cursos Relacionados
LangGraph Avanzado: Optimización, depuración y monitoreo de gráficos complejos
35 HorasLangGraph es un marco de trabajo para construir aplicaciones de LLM multi-actor con estado, mediante gráficos composables con estado persistente y control sobre la ejecución.
Esta capacitación en vivo, impartida por instructores (en línea o presencial), está dirigida a ingenieros de plataformas de IA de nivel avanzado, profesionales de DevOps para IA y arquitectos de ML que deseen optimizar, depurar, monitorear y operar sistemas de LangGraph de grado de producción.
Al finalizar esta capacitación, los participantes podrán:
- Diseñar y optimizar topologías complejas de LangGraph para lograr velocidad, eficiencia en costos y escalabilidad.
- Asegurar la confiabilidad mediante reintentos, tiempos de espera, idempotencia y recuperación basada en puntos de control (checkpointing).
- Depurar y rastrear la ejecución de gráficos, inspeccionar el estado y reproducir sistemáticamente los problemas en producción.
- Instrumentar gráficos con registros (logs), métricas y rastreo, desplegarlos en producción y monitorear los SLA y los costos.
Formato del curso
- Clases interactivas y discusiones.
- Abundantes ejercicios y práctica.
- Implementación práctica en un entorno de laboratorio en vivo.
Opciones de personalización del curso
- Para solicitar una capacitación personalizada para este curso, contáctenos para coordinar los detalles.
Construcción de Agentes de Código con Devstral: Del Diseño del Agente a la Herramientización
14 HorasDevstral es un framework de código abierto diseñado para construir y ejecutar agentes de código que pueden interactuar con bases de código, herramientas de desarrollo y API para mejorar la productividad de ingeniería.
Esta formación en vivo con instructor (en línea o presencial) está dirigida a ingenieros de ML de nivel intermedio a avanzado, equipos de herramientas de desarrollo y SRE que deseen diseñar, implementar y optimizar agentes de código utilizando Devstral.
Al finalizar esta formación, los participantes podrán:
- Configurar y adaptar Devstral para el desarrollo de agentes de código.
- Diseñar flujos de trabajo de agentes para la exploración y modificación de bases de código.
- Integrar agentes de código con herramientas de desarrollo y API.
- Implementar mejores prácticas para el despliegue seguro y eficiente de agentes.
Formato del Curso
- Clase magistral interactiva y discusión.
- Gran cantidad de ejercicios y práctica.
- Implementación práctica en un entorno de laboratorio en vivo.
Opciones de Personalización del Curso
- Para solicitar una formación personalizada para este curso, por favor contáctenos para coordinar.
Operaciones de modelos de código abierto: Autoalojamiento, ajuste fino y gobernanza con modelos Devstral y Mistral
14 HorasLos modelos Devstral y Mistral son tecnologías de inteligencia artificial de código abierto diseñadas para un despliegue flexible, ajuste fino e integración escalable.
Esta formación práctica impartida por instructores (en línea o presencial) está dirigida a ingenieros de ML de nivel intermedio a avanzado, equipos de plataforma e ingenieros de investigación que desean autoalojar, ajustar y gobernar los modelos Mistral y Devstral en entornos de producción.
Al finalizar esta formación, los participantes podrán:
- Configurar y preparar entornos de autoalojamiento para los modelos Mistral y Devstral.
- Aplicar técnicas de ajuste fino para mejorar el rendimiento específico del dominio.
- Implementar el control de versiones, monitoreo y gobernanza del ciclo de vida.
- Garantizar la seguridad, el cumplimiento normativo y el uso responsable de los modelos de código abierto.
Formato del curso
- Clase interactiva y discusión.
- Ejercicios prácticos de autoalojamiento y ajuste fino.
- Implementación en laboratorio en vivo de flujos de trabajo de gobernanza y monitoreo.
Opciones de personalización del curso
- Para solicitar una formación personalizada para este curso, contáctenos para organizarla.
Aplicaciones de LangGraph en Finanzas
35 HorasLangGraph es un marco de trabajo para construir aplicaciones de LLM multi-actor y con estado, mediante gráficos compositables con estado persistente y control sobre la ejecución.
Esta formación en vivo, guiada por un instructor (en línea o presencial), está dirigida a profesionales de nivel intermedio a avanzado que deseen diseñar, implementar y operar soluciones financieras basadas en LangGraph con la gobernanza, observabilidad y cumplimiento adecuados.
Al finalizar esta formación, los participantes podrán:
- Diseñar flujos de trabajo de LangGraph específicos para finanzas, alineados con los requisitos regulatorios y de auditoría.
- Integrar estándares y ontologías de datos financieros en el estado del gráfico y las herramientas.
- Implementar controles de confiabilidad, seguridad e intervención humana para procesos críticos.
- Desplegar, monitorear y optimizar sistemas LangGraph para rendimiento, costos y acuerdos de nivel de servicio (SLA).
Formato del Curso
- Clase interactiva y discusión.
- Muchas actividades prácticas y ejercicios.
- Implementación práctica en un entorno de laboratorio en vivo.
Opciones de Personalización del Curso
- Para solicitar una capacitación personalizada para este curso, contáctenos para organizarla.
Fundamentos de LangGraph: Llamada encadenada y generación de indicaciones para LLM basada en grafos
14 HorasLangGraph es un marco de trabajo para crear aplicaciones LLM estructuradas en grafos que admiten planificación, ramificación, uso de herramientas, memoria y ejecución controlable.
Esta formación en vivo con un instructor (en línea o presencial) está dirigida a desarrolladores principiantes, ingenieros de indicaciones y profesionales de datos que deseen diseñar y construir flujos de trabajo LLM multietapa confiables utilizando LangGraph.
Al finalizar esta formación, los participantes podrán:
- Explicar los conceptos básicos de LangGraph (nodos, bordes y estado) y cuándo utilizarlos.
- Construir cadenas de indicaciones que ramifiquen, llamen a herramientas y mantengan la memoria.
- Integrar recuperación de información y APIs externas en los flujos de trabajo basados en grafos.
- Probar, depurar y evaluar aplicaciones de LangGraph para garantizar su confiabilidad y seguridad.
Formato del curso
- Clase interactiva y discusión guiada.
- Laboratorios dirigidos y recorridos por el código en un entorno de simulación.
- Ejercicios basados en escenarios sobre diseño, pruebas y evaluación.
Opciones de personalización del curso
- Para solicitar una formación personalizada para este curso, contáctenos para coordinar los detalles.
LangGraph en el sector de la salud: Orquestación de flujos de trabajo para entornos regulados
35 HorasLangGraph permite diseñar flujos de trabajo con estados y múltiples actores, impulsados por modelos de lenguaje grandes (LLM), con un control preciso sobre las rutas de ejecución y la persistencia del estado. En el sector de la salud, estas capacidades son fundamentales para garantizar el cumplimiento normativo, la interoperabilidad y la creación de sistemas de apoyo a la decisión que se alineen con los flujos de trabajo médicos.
Esta formación, impartida por instructores, en línea o presencial, está dirigida a profesionales de nivel intermedio a avanzado que deseen diseñar, implementar y gestionar soluciones de salud basadas en LangGraph, abordando al mismo tiempo los desafíos regulatorios, éticos y operativos.
Al finalizar esta formación, los participantes podrán:
- Diseñar flujos de trabajo de LangGraph específicos para la salud, teniendo en cuenta el cumplimiento normativo y la trazabilidad.
- Integrar aplicaciones de LangGraph con ontologías y estándares médicos (FHIR, SNOMED CT, CIE).
- Aplicar las mejores prácticas de confiabilidad, trazabilidad y explicabilidad en entornos sensibles.
- Desplegar, monitorear y validar aplicaciones de LangGraph en entornos productivos de atención médica.
Formato del curso
- Clase interactiva y discusión.
- Ejercicios prácticos con casos de estudio del mundo real.
- Práctica de implementación en un entorno de laboratorio en vivo.
Opciones de personalización del curso
- Para solicitar una formación personalizada para este curso, por favor contáctenos para coordinar los detalles.
LangGraph para Aplicaciones Legales
35 HorasLangGraph es un marco de trabajo para construir aplicaciones de LLM (modelos de lenguaje grandes) stateful y multi-actor como grafos composables con estado persistente y control preciso sobre la ejecución.
Esta formación en vivo impartida por un instructor (en línea o en las instalaciones) está dirigida a profesionales de nivel intermedio a avanzado que desean diseñar, implementar y operar soluciones legales basadas en LangGraph con los controles necesarios de cumplimiento, trazabilidad y gobernanza.
Al finalizar esta formación, los participantes podrán:
- Diseñar flujos de trabajo de LangGraph específicos para el ámbito legal que preserven la auditabilidad y el cumplimiento normativo.
- Integrar ontologías legales y estándares de documentos en el estado del grafo y en el procesamiento.
- Implementar barreras de seguridad (guardrails), aprobaciones con intervención humana y caminos de decisión trazables.
- Desplegar, monitorear y mantener servicios de LangGraph en producción con capacidades de observabilidad y control de costos.
Formato del Curso
- Conferencia interactiva y debate.
- Numerosos ejercicios y práctica.
- Implementación práctica en un entorno de laboratorio en vivo.
Opciones de Personalización del Curso
- Para solicitar una formación personalizada para este curso, contáctenos para coordinar.
Construcción de Flujos de Trabajo Dinámicos con LangGraph y Agentes LLM
14 HorasLangGraph es un marco de trabajo para componer flujos de trabajo de LLM estructurados en grafo, que admiten ramificaciones, uso de herramientas, memoria y ejecución controlable.
Esta capacitación en vivo con instructor (en línea o presencial) está dirigida a ingenieros de nivel intermedio y equipos de producto que desean combinar la lógica de grafos de LangGraph con bucles de agentes LLM para construir aplicaciones dinámicas y conscientes del contexto, como agentes de atención al cliente, árboles de decisión y sistemas de recuperación de información.
Al finalizar esta capacitación, los participantes serán capaces de:
- Diseñar flujos de trabajo basados en grafos que coordinen agentes LLM, herramientas y memoria.
- Implementar enrutamiento condicional, reintentos y planes de contingencia para una ejecución robusta.
- Integrar recuperación, APIs y salidas estructuradas en los bucles de agentes.
- Evaluar, monitorear y endurecer el comportamiento de los agentes para garantizar confiabilidad y seguridad.
Formato del curso
- Clase interactiva y discusión facilitada.
- Laboratorios guiados y recorrido de código en un entorno de pruebas (sandbox).
- Ejercicios de diseño basados en escenarios y revisiones entre pares.
Opciones de personalización del curso
- Para solicitar una capacitación personalizada para este curso, comuníquese con nosotros para coordinarla.
LangGraph para Automatización de Marketing
14 HorasLangGraph es un framework de orquestación basado en grafos que permite flujos de trabajo condicionales y multifase con LLMs y herramientas, ideal para automatizar y personalizar pipelines de contenido.
Esta capacitación en vivo con instructor (en línea o presencial) está dirigida a marketers de nivel intermedio, estrategas de contenido y desarrolladores de automatización que deseen implementar campañas de email dinámicas y ramificadas, así como pipelines de generación de contenido, utilizando LangGraph.
Al finalizar esta capacitación, los participantes serán capaces de:
- Diseñar flujos de trabajo de contenido y email estructurados en grafo con lógica condicional.
- Integrar LLMs, APIs y fuentes de datos para una personalización automatizada.
- Gestionar el estado, la memoria y el contexto a través de campañas multifase.
- Evaluar, monitorear y optimizar el rendimiento del flujo de trabajo y los resultados de entrega.
Formato del Curso
- Conferencias interactivas y debates grupales.
- Prácticas de laboratorio implementando flujos de trabajo de email y pipelines de contenido.
- Ejercicios basados en escenarios sobre personalización, segmentación y lógica ramificada.
Opciones de Personalización del Curso
- Para solicitar una capacitación personalizada para este curso, por favor contáctenos para coordinar.
Le Chat Enterprise: ChatOps privado, integraciones y controles de administración
14 HorasLe Chat Enterprise es una solución de ChatOps privado que ofrece capacidades de IA conversacional seguras, personalizables y gobernadas para organizaciones, con soporte para control de acceso basado en roles (RBAC), inicio de sesión único (SSO), conectores e integraciones con aplicaciones empresariales.
Esta formación en vivo impartida por un instructor (en línea o presencial) está dirigida a gerentes de producto de nivel intermedio, líderes de TI, ingenieros de soluciones y equipos de seguridad y cumplimiento que deseen implementar, configurar y gobernar Le Chat Enterprise en entornos empresariales.
Al finalizar esta formación, los participantes serán capaces de:
- Configurar y ajustar Le Chat Enterprise para implementaciones seguras.
- Habilitar controles basados en RBAC, SSO y cumplimiento normativo.
- Integrar Le Chat con aplicaciones empresariales y almacenes de datos.
- Diseñar e implementar libretas de procedimientos de gobernanza y administración para ChatOps.
Formato del curso
- Conferencias y discusiones interactivas.
- Numerosos ejercicios y práctica.
- Implementación práctica en un entorno de laboratorio en vivo.
Opciones de personalización del curso
- Para solicitar una formación personalizada para este curso, contáctenos para coordinarla.
Arquitecturas de LLM rentables: Mistral a escala (Ingeniería de rendimiento/costo)
14 HorasMistral es una familia de modelos de lenguaje grandes de alto rendimiento, optimizada para su implementación en producción a escala de manera rentable.
Esta formación presencial, impartida por un instructor (en línea o in situ), está dirigida a ingenieros de infraestructura avanzados, arquitectos de nube y líderes de MLOps que desean diseñar, implementar y optimizar arquitecturas basadas en Mistral para lograr el máximo rendimiento y el mínimo costo.
Al finalizar esta formación, los participantes serán capaces de:
- Implementar patrones de despliegue escalables para Mistral Medium 3.
- Aplicar técnicas de agrupación (batching), cuantización y estrategias de servicio eficientes.
- Optimizar los costos de inferencia manteniendo el rendimiento.
- Diseñar topologías de servicio listas para producción para cargas de trabajo empresariales.
Formato del curso
- Clase interactiva y discusión.
- Muchos ejercicios y práctica.
- Implementación práctica en un entorno de laboratorio en vivo.
Opciones de personalización del curso
- Para solicitar una formación personalizada para este curso, contáctenos para coordinarlo.
Productizar asistentes conversacionales con conectores e integraciones de Mistral
14 HorasMistral AI es una plataforma de IA de código abierto que permite a los equipos construir e integrar asistentes conversacionales en flujos de trabajo empresariales y orientados al cliente.
Esta capacitación en vivo con instructor (en línea o presencial) está dirigida a gerentes de producto y desarrolladores full-stack de nivel principiante a intermedio, así como ingenieros de integración que deseen diseñar, integrar y productizar asistentes conversacionales utilizando conectores e integraciones de Mistral.
Al finalizar esta capacitación, los participantes podrán:
- Integrar modelos conversacionales de Mistral con conectores empresariales y de SaaS.
- Implementar generación aumentada por recuperación (RAG) para respuestas fundamentadas.
- Diseñar patrones de experiencia de usuario para asistentes de chat internos y externos.
- Desplegar asistentes en flujos de trabajo de productos para casos de uso reales.
Formato del curso
- Clase interactiva y discusión.
- Ejercicios prácticos de integración.
- Desarrollo en laboratorio en vivo de asistentes conversacionales.
Opciones de personalización del curso
- Para solicitar una capacitación personalizada para este curso, contáctenos para coordinar.
Implementaciones empresariales con Mistral Medium 3
14 HorasMistral Medium 3 es un modelo de lenguaje grande multimodal de alto rendimiento, diseñado para su implementación en entornos empresariales de nivel de producción.
Esta formación en vivo y dirigida por un instructor (en línea o presencial) está dirigida a ingenieros de IA/ML de nivel intermedio a avanzado, arquitectos de plataformas y equipos de MLOps que deseen implementar, optimizar y asegurar Mistral Medium 3 para casos de uso empresarial.
Al finalizar esta formación, los participantes serán capaces de:
- Implementar Mistral Medium 3 utilizando opciones mediante API y autoalojamiento.
- Optimizar el rendimiento y los costos de la inferencia.
- Implementar casos de uso multimodal con Mistral Medium 3.
- Aplicar las mejores prácticas de seguridad y cumplimiento para entornos empresariales.
Formato del curso
- Clase interactiva y discusión.
- Extenso número de ejercicios y práctica.
- Implementación práctica en un entorno de laboratorio en vivo.
Opciones de personalización del curso
- Para solicitar una formación personalizada para este curso, por favor contáctenos para coordinar los detalles.
Mistral para una IA responsable: privacidad, residencia de datos y controles empresariales
14 HorasMistral AI es una plataforma de IA abierta y preparada para entornos empresariales que ofrece características para el despliegue seguro, conforme y responsable de la inteligencia artificial.
Esta formación en vivo con instrucción directa (en línea o presencial) está dirigida a profesionales de cumplimiento de nivel intermedio, arquitectos de seguridad y partes interesadas legales y operativas que desean implementar prácticas de IA responsable con Mistral, aprovechando los mecanismos de privacidad, residencia de datos y control empresarial.
Al finalizar esta formación, los participantes serán capaces de:
- Implementar técnicas de preservación de la privacidad en los despliegues de Mistral.
- Aplicar estrategias de residencia de datos para cumplir con los requisitos normativos.
- Configurar controles de nivel empresarial, como control de acceso basado en roles (RBAC), inicio de sesión único (SSO) y registros de auditoría.
- Evaluar opciones de proveedores y modelos de despliegue para alinearse con el cumplimiento normativo.
Formato del curso
- Clase interactiva y discusión.
- Casos de estudio y ejercicios centrados en el cumplimiento normativo.
- Implementación práctica de controles de IA empresarial.
Opciones de personalización del curso
- Para solicitar una formación personalizada para este curso, contáctenos para organizar los detalles.
Aplicaciones Multimodales con Modelos Mistral (Visión, OCR y Comprensión de Documentos)
14 HorasLos modelos Mistral son tecnologías de inteligencia artificial de código abierto que ahora se integran en flujos de trabajo multimodales, admitiendo tanto tareas de lenguaje como de visión para aplicaciones empresariales y de investigación.
Esta formación en vivo y con instructor (en línea o presencial) está dirigida a investigadores de aprendizaje automático (ML) de nivel intermedio, ingenieros aplicados y equipos de producto que deseen construir aplicaciones multimodales con modelos Mistral, incluidos flujos de trabajo de OCR y comprensión de documentos.
Al finalizar esta formación, los participantes serán capaces de:
- Configurar y personalizar los modelos Mistral para tareas multimodales.
- Implementar flujos de trabajo de OCR e integrarlos con pipelines de procesamiento de lenguaje natural (PLN).
- Diseñar aplicaciones de comprensión de documentos para casos de uso empresarial.
- Desarrollar funcionalidades de búsqueda de texto-vision e interfaces de usuario asistenciales.
Formato del Curso
- Lección interactiva y discusión.
- Ejercicios prácticos de programación.
- Implementación en laboratorio en vivo de pipelines multimodales.
Opciones de Personalización del Curso
- Para solicitar una formación personalizada para este curso, contáctenos para coordinarlo.