Contacta con nosotros

Temario del curso

Temario detallado del entrenamiento

  1. Introducción al PLN
    • Comprensión del PLN
    • Frameworks de PLN
    • Aplicaciones comerciales del PLN
    • Extracción de datos de la web
    • Trabajo con diversas APIs para recuperar datos de texto
    • Trabajo y almacenamiento de corpora de texto, guardando el contenido y metadatos relevantes
    • Ventajas de usar Python y curso intensivo de NLTK
  2. Comprensión práctica de un Corpus y Conjunto de Datos
    • ¿Por qué necesitamos un corpus?
    • Análisis de corpus
    • Tipos de atributos de datos
    • Diferentes formatos de archivos para corpora
    • Preparación de un conjunto de datos para aplicaciones de PLN
  3. Comprensión de la Estructura de las Oraciones
    • Componentes del PLN
    • Comprensión del lenguaje natural
    • Análisis morfológico: raíz, palabra, token, etiquetas de parte del habla
    • Análisis sintáctico
    • Análisis semántico
    • Manejo de la ambigüedad
  4. Preprocesamiento de datos de texto
    • Corpus: texto sin procesar
      • Tokenización de oraciones
      • Stemming para texto sin procesar
      • Lematización de texto sin procesar
      • Eliminación de palabras vacías
    • Corpus: oraciones sin procesar
      • Tokenización de palabras
      • Lematización de palabras
    • Trabajo con matrices Término-Documento/Documento-Término
    • Tokenización de texto en n-gramas y oraciones
    • Preprocesamiento práctico y personalizado
  5. Análisis de Datos de Texto
    • Características básicas del PLN
      • Analizadores y análisis
      • Etiquetado POS y etiquetadores
      • Reconocimiento de entidades nombradas
      • N-gramas
      • Bolsa de palabras
    • Características estadísticas del PLN
      • Conceptos de álgebra lineal para PLN
      • Teoría probabilística para PLN
      • TF-IDF
      • Vectorización
      • Codificadores y Decodificadores
      • Normalización
      • Modelos Probabilísticos
    • Ingeniería avanzada de características y PLN
      • Fundamentos de word2vec
      • Componentes del modelo word2vec
      • Lógica del modelo word2vec
      • Extensión del concepto word2vec
      • Aplicación del modelo word2vec
    • Caso de estudio: Aplicación de la bolsa de palabras: resumen automático de texto usando algoritmos simplificados y reales de Luhn
  6. Agrupación, Clasificación de Documentos y Modelado de Temas
    • Agrupación de documentos y minería de patrones (clustering jerárquico, k-means, clustering, etc.)
    • Comparación y clasificación de documentos usando medidas de distancia TFIDF, Jaccard y coseno
    • Clasificación de documentos usando Bayes ingenuo y Máxima Entropía
  7. Identificación de Elementos de Texto Importantes
    • Reducción de dimensionalidad: Análisis de Componentes Principales, Descomposición en Valores Singulares (SVD) y Factorización de Matrices No Negativas
    • Modelado de temas y recuperación de información usando Análisis Semántico Latente
  8. Extracción de Entidades, Análisis de Sentimiento y Modelado de Temas Avanzado
    • Positivo vs. negativo: grado de sentimiento
    • Teoría de Respuesta al Ítem
    • Etiquetado de partes del habla y su aplicación: encontrar personas, lugares y organizaciones mencionadas en el texto
    • Modelado de temas avanzado: Distribución de Dirichlet Latente (LDA)
  9. Casos de estudio
    • Minería de reseñas de usuarios no estructuradas
    • Clasificación de sentimiento y visualización de datos de reseñas de productos
    • Minería de registros de búsqueda para patrones de uso
    • Clasificación de texto
    • Modelado de temas

Requerimientos

Conocimiento y conciencia de los principios del PLN y una apreciación de la aplicación de la IA en los negocios

 21 Horas

Número de participantes


Precio por participante

Testimonios (1)

Próximos cursos

Categorías Relacionadas