Propósito del Curso
El curso tiene como objetivo explicar las habilidades fundamentales y avanzadas necesarias para analizar, transformar y aplicar modelos de lenguaje en datos de texto no estructurados. El curso explora las prácticas esenciales del preprocesamiento de texto, que es indispensable para transformar el lenguaje humano a un formato legible por máquinas. Esto incluye: preprocesamiento y limpieza de texto, conversión de texto a representaciones numéricas y la aplicación de algoritmos de Machine Learning para problemas como clasificación de textos, el análisis de sentimientos, modelado de temas, Generación de texto, entre otros.
Es un curso teórico - práctico enfocado en el idioma español y se busca asegurar desarrollar soluciones de NLP eficientes y escalables, aprovechando los modelos pre-entrenados para resolver problemas reales y preparados para el despliegue en entornos de producción.
Conocimientos Previos
- Python (Pandas, Scikit Learn, Numpy, Matplotlib)
- Machine Learning (Aprendizaje supervisado y no supervisado)
Contenido
1. Introducción
Introducción al curso de NLP y minería de texto
2. Configuración Entorno
Configuración del entorno de desarrollo para proyectos de Machine Learning.
3. Procesamiento Básico
Procesamiento Básico de Texto
4. Preprocesamiento
Técnicas de limpieza y normalización de texto para NLP
5. Representaciones
Técnicas de representación de texto para NLP
6. Transformers
Introducción a los modelos Transformer y su aplicación en NLP.
7. LLMS
Aplicaciones de Modelos de Lenguaje de Gran Tamaño (LLMs).
Herramientas para el curso
Python | Pandas | Scikit-learn |
transformers | datasets | NLTK |
Github Pro | Git | IDE - Vscode |
Copilot | Jupyter | UV |
Referencias
Libros y Papers
- Speech and Language Processing (3rd Edition)
- Natural Language Processing with Python - Steven Bird, Ewan Klein, and Edward Loper (2009)
- Software Engineering for Data Scientists - Catherine Nelson (2024)