Jupyter para Equipos de Ciencia de Datos
Jupyter es un entorno interactivo basado en la web y un IDE de código abierto.
Esta formación práctica en vivo (en línea o presencial) introduce el concepto de desarrollo colaborativo en ciencia de datos y demuestra cómo utilizar Jupyter para realizar un seguimiento y participar como equipo en el "ciclo de vida de una idea computacional". Guía a los participantes en la creación de un proyecto de muestra de ciencia de datos basado en el ecosistema de Jupyter.
Al finalizar esta formación, los participantes podrán:
- Instalar y configurar Jupyter, incluida la creación e integración de un repositorio del equipo en Git.
- Utilizar las funciones de Jupyter, como extensiones, widgets interactivos, modo multiusuario y más, para habilitar la colaboración en el proyecto.
- Crear, compartir y organizar cuadernos de Jupyter con los miembros del equipo.
- Elegir entre Scala, Python o R para escribir y ejecutar código contra sistemas de big data como Apache Spark, todo ello a través de la interfaz de Jupyter.
Formato del curso
- Clase interactiva y discusión.
- Muchas prácticas y ejercicios.
- Implementación práctica en un entorno de laboratorio en vivo.
Opciones de personalización del curso
- El cuaderno Jupyter admite más de 40 lenguajes, incluyendo R, Python, Scala, Julia, etc. Para personalizar este curso según su(s) lenguaje(s) preferido(s), contáctenos para coordinarlo.
Temario del curso
Introducción a Jupyter
- Visión general de Jupyter y su ecosistema
- Instalación y configuración
- Configuración de Jupyter para la colaboración en equipo
Características colaborativas
- Uso de Git para el control de versiones
- Extensiones y widgets interactivos
- Modo multiusuario
Creación y gestión de cuadernos
- Estructura y funcionalidad del cuaderno
- Compartir y organizar cuadernos
- Mejores prácticas para la colaboración
Programación con Jupyter
- Elegir y utilizar lenguajes de programación (Python, R, Scala)
- Escribir y ejecutar código
- Integración con sistemas de big data (Apache Spark)
Características avanzadas de Jupyter
- Personalización del entorno Jupyter
- Automatización de flujos de trabajo con Jupyter
- Exploración de casos de uso avanzados
Sesiones prácticas
- Prácticas de laboratorio
- Proyectos reales de ciencia de datos
- Ejercicios grupales y revisiones por pares
Resumen y próximos pasos
Requerimientos
- Experiencia de programación en lenguajes como Python, R, Scala, etc.
- Conocimientos previos en ciencia de datos
Dirigido a
- Equipos de ciencia de datos
Los cursos públicos requieren más de 5 participantes.
Jupyter para Equipos de Ciencia de Datos - Reserva
Jupyter para Equipos de Ciencia de Datos - Consulta
Jupyter para Equipos de Ciencia de Datos - Solicitud de consultoría
Testimonios (1)
Es genial que el curso esté personalizado para las áreas clave que destacué en el cuestionario previo al curso. Esto realmente ayuda a abordar las preguntas que tengo sobre la materia y a alinearse con mis objetivos de aprendizaje.
Winnie Chan - Statistics Canada
Curso - Jupyter for Data Science Teams
Traducción Automática
Próximos cursos
Cursos Relacionados
Introducción a la Ciencia de Datos e IA con Python
35 HorasSe adentra en enfoques prácticos de la Ciencia de Datos e Inteligencia Artificial utilizando Python, dotando a los profesionales de las habilidades necesarias para explorar datos, construir modelos de aprendizaje automático y desplegar aplicaciones impulsadas por IA en contextos empresariales. Cubre los flujos de trabajo CRISP-DM, análisis estadístico, aprendizaje supervisado y no supervisado, aprendizaje profundo con Tensorflow, procesamiento de lenguaje natural, big data con Spark y narración de datos. Es ideal para principiantes que buscan una certificación en ciencia de datos con Python y una formación analítica orientada a la empleabilidad.
Apache Airflow para Ciencia de Datos: Automatización de Pipelines de Aprendizaje Automático
21 HorasEsta formación en vivo con instructor en Costa Rica (en línea o presencial) está dirigida a participantes de nivel intermedio que deseen automatizar y gestionar flujos de trabajo de aprendizaje automático, incluyendo el entrenamiento de modelos, validación y despliegue utilizando Apache Airflow.
Al finalizar esta formación, los participantes podrán:
- Configurar Apache Airflow para la orquestación de flujos de trabajo de aprendizaje automático.
- Automatizar tareas de preprocesamiento de datos, entrenamiento de modelos y validación.
- Integrar Airflow con frameworks y herramientas de aprendizaje automático.
- Desplegar modelos de aprendizaje automático mediante pipelines automatizados.
- Monitorear y optimizar flujos de trabajo de aprendizaje automático en producción.
Ecosistema de Anaconda para Científicos de Datos
14 HorasEsta formación presencial impartida por un instructor en <ubicación> (en línea o in situ) está dirigida a científicos de datos que desean utilizar el ecosistema de Anaconda para capturar, gestionar e implementar paquetes y flujos de trabajo de análisis de datos en una plataforma única.
Al finalizar esta formación, los participantes podrán:
- Instalar y configurar los componentes y bibliotecas de Anaconda.
- Comprender los conceptos fundamentales, características y beneficios de Anaconda.
- Gestionar paquetes, entornos y canales utilizando Anaconda Navigator.
- Utilizar paquetes de Conda, R y Python para ciencia de datos y aprendizaje automático.
- Conocer algunos casos de uso prácticos y técnicas para gestionar múltiples entornos de datos.
AWS Cloud9 para Ciencia de Datos
28 HorasEsta capacitación en vivo y con instructor en Costa Rica (en línea o presencial) está dirigida a científicos de datos y analistas de nivel intermedio que desean utilizar AWS Cloud9 para optimizar sus flujos de trabajo de ciencia de datos.
Al finalizar esta capacitación, los participantes serán capaces de:
- Configurar un entorno de ciencia de datos en AWS Cloud9.
- Realizar análisis de datos utilizando Python, R y Jupyter Notebook en Cloud9.
- Integrar AWS Cloud9 con servicios de datos de AWS como S3, RDS y Redshift.
- Utilizar AWS Cloud9 para el desarrollo e implementación de modelos de aprendizaje automático.
- Optimizar flujos de trabajo basados en la nube para el análisis y procesamiento de datos.
Introducción a Google Colab para Ciencia de Datos
14 HorasEsta formación en vivo impartida por un instructor en <ubicación> (en línea o presencial) está dirigida a científicos de datos y profesionales de TI de nivel principiante que desean aprender los conceptos básicos de la ciencia de datos utilizando Google Colab.
Al finalizar esta capacitación, los participantes serán capaces de:
- Configurar y navegar por Google Colab.
- Escribir y ejecutar código Python básico.
- Importar y manipular conjuntos de datos.
- Crear visualizaciones utilizando librerías de Python.
Data Science essential for para los profesionales de marketing / ventas
21 HorasEste curso está diseñado para profesionales de marketing y ventas que desean adentrarse más en la aplicación de la ciencia de datos en marketing y ventas. El curso proporciona una cobertura detallada de diferentes técnicas de ciencia de datos utilizadas para la "venta adicional" (upsale), la "venta cruzada" (cross-sale), la segmentación de mercado, la construcción de marca y el valor de vida del cliente (CLV).
Diferencia entre marketing y ventas - ¿En qué se diferencian las ventas del marketing?
En palabras muy sencillas, las ventas pueden definirse como un proceso que se centra o se dirige a individuos o grupos pequeños. El marketing, por otro lado, se dirige a un grupo más amplio o al público en general. El marketing incluye la investigación (identificación de las necesidades del cliente), el desarrollo de productos (creación de productos innovadores) y la promoción del producto (a través de anuncios) para generar conciencia sobre el mismo entre los consumidores. En este sentido, el marketing significa generar clientes potenciales (leads). Una vez que el producto está en el mercado, corresponde al vendedor persuadir al cliente para que lo compre. Las ventas significan convertir esos clientes potenciales en compras y pedidos, mientras que el marketing está orientado a objetivos a largo plazo, y las ventas se refieren a metas a corto plazo.
Kaggle
14 HorasEsta formación en vivo dirigida por un instructor en Costa Rica (en línea o presencial) está dirigida a científicos de datos y desarrolladores que desean aprender y desarrollar sus carreras en Ciencia de Datos utilizando Kaggle.
Al final de esta formación, los participantes serán capaces de:
- Aprender sobre ciencia de datos y aprendizaje automático.
- Explorar el análisis de datos.
- Aprender sobre Kaggle y cómo funciona.
Ciencia de Datos con la Plataforma KNIME Analytics
21 HorasLa Plataforma KNIME Analytics es una opción líder de código abierto para la innovación impulsada por datos, que te ayuda a descubrir el potencial oculto en tus datos, extraer nuevas perspectivas o prever futuros posibles. Con más de 1000 módulos, cientos de ejemplos listos para ejecutar, una amplia gama de herramientas integradas y la mayor variedad de algoritmos avanzados disponibles, la Plataforma KNIME Analytics es la caja de herramientas perfecta para cualquier científico de datos y analista de negocios.
Este curso de la Plataforma KNIME Analytics es la oportunidad ideal para principiantes, usuarios avanzados y expertos en KNIME para familiarizarse con KNIME, aprender a usarlo de manera más efectiva y crear informes claros y completos basados en flujos de trabajo de KNIME.
Esta formación en vivo con instructor (en línea o presencial) está dirigida a profesionales de datos que desean utilizar KNIME para resolver necesidades empresariales complejas.
Está orientada a un público que no conoce la programación y tiene la intención de utilizar herramientas de vanguardia para implementar escenarios analíticos.
Al finalizar esta capacitación, los participantes podrán:
- Instalar y configurar KNIME.
- Construir escenarios de ciencia de datos.
- Entrenar, probar y validar modelos.
- Implementar la cadena de valor completa de los modelos de ciencia de datos.
Formato del Curso
- Conferencia interactiva y discusión.
- Muchas ejercicios y práctica.
- Implementación práctica en un entorno de laboratorio en vivo.
Opciones de Personalización del Curso
- Para solicitar una capacitación personalizada para este curso o para obtener más información sobre este programa, por favor contáctenos para coordinar.
Aprendizaje Automático - Ciencia de Datos
21 HorasEsta formación en vivo impartida por un instructor en Costa Rica (en línea o en las instalaciones) está dirigida a analistas de datos, desarrolladores o futuros científicos de datos de nivel intermedio que desean aplicar técnicas de aprendizaje automático en Python para extraer información, realizar predicciones y automatizar decisiones basadas en datos.
Al finalizar este curso, los participantes podrán:
- Comprender y diferenciar los paradigmas clave del aprendizaje automático.
- Explorar técnicas de preprocesamiento de datos y métricas de evaluación de modelos.
- Aplicar algoritmos de aprendizaje automático para resolver problemas reales de datos.
- Utilizar bibliotecas de Python y cuadernos de Jupyter para el desarrollo práctico.
- Construir modelos para predicción, clasificación, recomendación y agrupamiento.
Introducción a los Modelos Preentrenados
14 HorasEsta formación en vivo, impartida por un instructor en <ubicación> (en línea o presencial), está dirigida a profesionales de nivel principiante que desean comprender el concepto de los modelos preentrenados y aprender a aplicarlos para resolver problemas reales, sin necesidad de construir modelos desde cero.
Al finalizar esta formación, los participantes podrán:
- Comprender el concepto y los beneficios de los modelos preentrenados.
- Explorar diversas arquitecturas de modelos preentrenados y sus casos de uso.
- Afinar (fine-tune) un modelo preentrenado para tareas específicas.
- Implementar modelos preentrenados en proyectos simples de aprendizaje automático.
Programación Python para Finanzas
35 HorasPython es un lenguaje de programación que ha ganado una enorme popularidad en la industria financiera. Adopción por parte de los principales bancos de inversión y fondos de cobertura, se utiliza para desarrollar una amplia gama de aplicaciones financieras, desde programas de operaciones centrales hasta sistemas de gestión de riesgos.
En esta capacitación en vivo y dirigida por un instructor, los participantes aprenderán a utilizar Python para desarrollar aplicaciones prácticas que resuelvan diversos problemas específicos relacionados con las finanzas.
Al finalizar esta capacitación, los participantes podrán:
- Comprender los fundamentos del lenguaje de programación Python
- Descargar, instalar y mantener las mejores herramientas de desarrollo para crear aplicaciones financieras en Python
- Seleccionar y utilizar los paquetes y técnicas de programación de Python más adecuados para organizar, visualizar y analizar datos financieros provenientes de diversas fuentes (CSV, Excel, bases de datos, web, etc.)
- Desarrollar aplicaciones que resuelvan problemas relacionados con la asignación de activos, análisis de riesgos, rendimiento de inversiones y más
- Diagnosticar, integrar, implementar y optimizar una aplicación en Python
Audiencia objetivo
- Desarrolladores
- Analistas
- Quants (cuantitativos)
Formato del curso
- Parte teórica, parte de discusión, ejercicios y mucha práctica hands-on
Nota
- Esta capacitación busca ofrecer soluciones para algunos de los problemas principales que enfrentan los profesionales financieros. Sin embargo, si deseas abordar un tema, herramienta o técnica específica en mayor profundidad, por favor contáctanos para coordinarlo.
Ciencia de Datos con GPU usando NVIDIA RAPIDS
14 HorasEsta formación en vivo con instructor en Costa Rica (en línea o presencial) está dirigida a científicos de datos y desarrolladores que desean utilizar RAPIDS para construir pipelines de datos acelerados por GPU, flujos de trabajo y visualizaciones, aplicando algoritmos de aprendizaje automático como XGBoost, cuML, etc.
Al finalizar esta formación, los participantes podrán:
- Configurar el entorno de desarrollo necesario para construir modelos de datos con NVIDIA RAPIDS.
- Comprender las características, componentes y ventajas de RAPIDS.
- Aprovechar las GPU para acelerar los pipelines de datos y análisis de extremo a extremo.
- Implementar la preparación de datos y ETL acelerados por GPU con cuDF y Apache Arrow.
- Aprender a realizar tareas de aprendizaje automático con los algoritmos XGBoost y cuML.
- Construir visualizaciones de datos y ejecutar análisis de grafos con cuXfilter y cuGraph.