Curso de Minería y Análisis de Datos
Objetivo:
Los delegados serán capaces de analizar grandes conjuntos de datos, extraer patrones, elegir la variable correcta que impacte los resultados para que un nuevo modelo se pronostique con resultados predictivos.
Programa del Curso
-
Preprocesamiento de datos
- Data Cleaning
- Integración y transformación de datos
- Reducción de datos
- Discretización y generación de jerarquías de conceptos
-
Inferencia estadística
- Distribuciones de probabilidad, Variables aleatorias, Teorema del límite central
- Muestreo
- Intervalos de confianza
- Inferencia estadística
- Prueba de hipótesis
-
Regresión lineal multivariante
- Especificación
- Selección de subconjuntos
- Estimación
- Validación
- Predicción
-
Métodos de clasificación
- Regresión logística
- Análisis discriminante lineal
- K-Vecinos más cercanos
- Bayes ingenuo
- Comparación de métodos de clasificación
-
Neural Networks
- Adaptación de redes neuronales
- Problemas de entrenamiento de redes neuronales
-
Árboles de decisión
- Árboles de regresión
- Árboles de clasificación
- Árboles frente a modelos lineales
-
Embolsado, Random Forests, Potenciador
- Embolsado
- Random Forest s
- Impulsar
-
Máquinas vectoriales de soporte y disco flexible
- Clasificador de margen máximo
- Clasificadores de vectores de soporte
- Máquinas de vectores de soporte
- 2 y más clases de SVM's
- Relación con la regresión logística
-
Análisis de Componentes Principales
-
Agrupamiento
- Agrupamiento de K-medias
- Agrupamiento de K-medoides
- Agrupación jerárquica
- Agrupación en clústeres basada en la densidad
-
Evaluación y selección de modelos
- Sesgo, varianza y complejidad del modelo
- Error de predicción en la muestra
- El enfoque bayesiano
- Validación cruzada
- Bootstrap Métodos
Los cursos de formación abiertos requieren más de 5 participantes.
Curso de Minería y Análisis de Datos - Booking
Curso de Minería y Análisis de Datos - Enquiry
Minería y Análisis de Datos - Consultas
Consultas
Testimonios (5)
Me beneficié de la orientación y los ejemplos de vida compartidos + respuesta a todas las preguntas.
Marta Melloch - Amazon Development Center Poland Sp. z o.o.
Curso - Data Mining and Analysis
Traducción Automática
Realmente disfruté todo lo mejor.
Halil polat - Amazon Development Center Poland Sp. z o.o.
Curso - Data Mining and Analysis
Traducción Automática
The information given was interesting and the best part was towards the end when we were provided with Data from Durex and worked on Data we are familiar with and perform operations to get results.
Jessica Chaar
Curso - Data Mining and Analysis
Traducción Automática
The hands-on exercise and the trainer capacity to explain complex topics in simple terms.
youssef chamoun
Curso - Data Mining and Analysis
Traducción Automática
I like the exercises done.
Nour Assaf
Curso - Data Mining and Analysis
Traducción Automática
Próximos cursos
Cursos Relacionados
Programación con Big Data en R
21 HorasBig Data es un término que se refiere a las soluciones destinadas a almacenar y procesar grandes conjuntos de datos. Desarrolladas por Go ogle inicialmente, estas soluciones de Big Data han evolucionado e inspirado a otros proyectos similares, muchos de los cuales están disponibles como código abierto. R es un lenguaje de programación popular en la industria financiera.
Fundamentos de R
21 HorasR es un lenguaje de programación libre de código abierto para computación estadística, análisis de datos y gráficos. R es utilizado por un número creciente de gerentes y analistas de datos dentro de las corporaciones y el mundo académico. R también ha encontrado seguidores entre los estadísticos, ingenieros y científicos sin habilidades de programación de computadoras que les resulta fácil de usar. Su popularidad se debe al uso cada vez mayor de la minería de datos para varios objetivos, como establecer precios de anuncios, encontrar nuevos medicamentos más rápidamente o ajustar los modelos financieros. R tiene una amplia variedad de paquetes para minería de datos.
Minería de Datos con R
14 HorasR es un lenguaje de programación gratuito de código abierto para computación estadística, análisis de datos y gráficos. R es utilizado por un número cada vez mayor de gerentes y analistas de datos dentro de las corporaciones y el mundo académico. R tiene una amplia variedad de paquetes para la minería de datos.
Econometrics: Eviews and Risk Simulator
21 HorasEsta capacitación en vivo dirigida por un instructor en Costa Rica (en línea o en el sitio) está dirigida a cualquier persona que desee aprender y dominar los fundamentos del análisis y modelado econométrico.
Al final de esta capacitación, los participantes serán capaces de:
- Aprenda y comprenda los fundamentos de la econometría.
- Utilice Eviews y simuladores de riesgo.
Pronosticar con R
14 HorasEste entrenamiento en vivo dirigido por instructor en Costa Rica (en línea o en el sitio) está dirigido a analistas de datos y profesionales de negocios de nivel intermedio que desean realizar pronósticos de series de tiempo y automatizar flujos de trabajo de análisis de datos utilizando R.
Al final de esta capacitación, los participantes podrán:
- Entender los fundamentos de las técnicas de pronóstico en R.
- Aplicar modelos de suavizado exponencial y ARIMA para el análisis de series temporales.
- Utilizar el paquete 'forecast' para generar modelos de pronóstico precisos.
- Automatizar flujos de trabajo de pronóstico para aplicaciones comerciales e investigativas.
HR Analytics for Public Organisations
14 HorasEsta formación en vivo dirigida por un instructor (en línea o presencial) está dirigida a profesionales de RRHH que deseen utilizar métodos analíticos para mejorar el rendimiento de la organización. Este curso cubre enfoques cualitativos, cuantitativos, empíricos y estadísticos.
Formato del curso
- Charla y discusión interactiva.
- Muchos ejercicios y práctica.
Opciones de personalización del curso
- Para solicitar una formación personalizada para este curso, póngase en contacto con nosotros para concertarlo.
Análisis de Marketing con R
21 HorasAudiencia
Propietarios de Business (gerentes de marketing, gerentes de productos, gerentes de base de clientes) y sus equipos; Perspectivas de clientes profesionales.
Visión general
El curso sigue el ciclo de vida del cliente desde la adquisición de nuevos clientes, la gestión de los clientes existentes para obtener rentabilidad, la retención de buenos clientes y, finalmente, la comprensión de qué clientes nos están dejando y por qué. Trabajaremos con datos reales (si son anónimos) de una variedad de industrias que incluyen telecomunicaciones, seguros, medios y alta tecnología.
Formato
Capacitación dirigida por un instructor a lo largo de cinco sesiones de medio día con ejercicios en clase y tareas. Se puede entregar como un aula o un curso a distancia (en línea).
R para Análisis de Datos e Investigación
7 HorasAudiencia
- gerentes
- Desarrolladores
- científicos
- estudiantes
Formato del curso
instrucción y discusión en línea O talleres presenciales
Introducción a R
21 HorasR es un lenguaje de programación gratuito de código abierto para computación estadística, análisis de datos y gráficos. R es utilizado por un número creciente de gerentes y analistas de datos dentro de las corporaciones y el mundo académico. R también ha encontrado adeptos entre estadísticos, ingenieros y científicos sin conocimientos de programación informática a los que les resulta fácil de usar. Su popularidad se debe al creciente uso de la minería de datos para diversos objetivos, como fijar precios publicitarios, encontrar nuevos medicamentos más rápidamente o afinar modelos financieros. R tiene una amplia variedad de paquetes para la minería de datos.
Este curso cubre la manipulación de objetos en R, incluida la lectura de datos, el acceso a paquetes de R, la escritura de funciones de R y la creación de gráficos informativos. Incluye el análisis de datos utilizando modelos estadísticos comunes. El curso enseña a utilizar el software R (https://www.r-project.org) tanto en una línea de comandos como en una interfaz gráfica de usuario (GUI).
R
21 HorasR es un lenguaje de programación libre de código abierto para computación estadística, análisis de datos y gráficos. R es utilizado por un número creciente de gerentes y analistas de datos dentro de las corporaciones y el mundo académico. R también ha encontrado adeptos entre estadísticos, ingenieros y científicos sin conocimientos de programación informática que lo encuentran fácil de usar. Su popularidad se debe al uso cada vez mayor de la minería de datos para diversos objetivos, como establecer precios publicitarios, encontrar nuevos medicamentos más rápidamente o afinar modelos financieros. R tiene una amplia variedad de paquetes para la minería de datos.
Red Neuronal en R
14 HorasEste curso es una introducción a la aplicación de redes neuronales en problemas del mundo real utilizando el software R-project.
Programación Avanzada de R
7 HorasEste curso es para científicos de datos y estadísticos que ya tienen habilidades básicas de codificación R & C++ y código R y necesitan habilidades avanzadas de codificación R
El propósito es impartir un curso práctico de programación avanzada de R a los participantes interesados en aplicar los métodos en el trabajo.
Se utilizan ejemplos específicos del sector para que la capacitación sea relevante para el público.
Análisis Estadístico Mediante SPSS
21 HorasEste entrenamiento en vivo dirigido por un instructor en Costa Rica (en línea o en el sitio) está orientado a profesionales de nivel principiante a intermedio que desean realizar análisis estadísticos utilizando SPSS para interpretar datos con precisión, realizar pruebas estadísticas complejas y generar información significativa.
Al final de esta capacitación, los participantes podrán:
- Navegar por la interfaz de SPSS y gestionar conjuntos de datos de manera eficiente.
- Realizar análisis estadísticos descriptivos e inferenciales.
- Realizar pruebas t, ANOVA, MANOVA, regresión y análisis de correlación.
- Aplicar pruebas no paramétricas, análisis de componentes principales y análisis factorial para la interpretación avanzada de datos.
Talent Acquisition Analytics
14 HorasEsta formación en vivo dirigida por un instructor (en línea o presencial) está dirigida a profesionales de RRHH y especialistas en contratación que deseen utilizar métodos analíticos para mejorar el rendimiento de la organización. Este curso cubre enfoques cualitativos, cuantitativos, empíricos y estadísticos.
Formato del curso
- Charla y discusión interactiva.
- Muchos ejercicios y práctica.
Opciones de personalización del curso
- Para solicitar una formación personalizada para este curso, póngase en contacto con nosotros para concertarlo.
Introducción a la visualización de datos con Tidyverse y R
7 HorasEl Tidyverse es una colección de paquetes R versátiles para limpiar, procesar, modelar y visualizar datos. Algunos de los paquetes incluidos son: ggplot2, dplyr, tidyr, readr, purrr y tibble.
En esta capacitación en vivo dirigida por un instructor, los participantes aprenderán cómo manipular y visualizar datos utilizando las herramientas incluidas en Tidyverse.
Al final de esta capacitación, los participantes podrán:
- Realice análisis de datos y cree visualizaciones atractivas
- Sacar conclusiones útiles de diversos conjuntos de datos de datos de muestra
- Filtrar, clasificar y resumir datos para responder preguntas exploratorias
- Convierta los datos procesados en gráficos de líneas informativas, gráficos de barras, histogramas
- Importe y filtre datos de diversas fuentes de datos, incluidos los archivos Excel, CSV y SPSS
Audiencia
- Principiantes al lenguaje R
- Principiantes para el análisis de datos y la visualización de datos
Formato del curso
- Conferencia de parte, discusión en parte, ejercicios y práctica práctica