Proposito del Curso
Definir un procedimiento para estructurar y desarrollar un proyecto de Ciencia de Datos de inicio a produccion y que se integre con procesos de MLOps mediante Python como herramienta para :
- Extracción, transformación y carga de datos.
- Limpieza de datos
- Análisis estadístico descriptivo de los datos.
- Visualizacion de datos
- Modelamiento (Seleccion de modelos e Hiperparametrizacion) y evaluación de sistemas de aprendizaje de máquina supervisados y no supervisados.
- despliegue de modelos de machine learning
Diapositivas
Conocimientos Previos
- Python (Pandas, Scikit Learn, Numpy, Matplotlib)
- Estadistica descriptiva
- Machine Learning (Aprendizaje supervizado y no supervizado)
Contenido
Herramientas
Herramientas para realizar proyectos de ciencia de datos
Flujo de Trabajo
Flujo de trabajo en el proceso productivo de un proyecto de Ciencia de datos
Evaluacion
Trabajos y evaluacion del curso
Referencias
- Machine learning con Python y Scikit-learn
- MLOps Zoomcamp course
- Effective Data Science Infrastructure: , How to make data scientists productive, Ville Tuulos, July 2022, 352 pages.
- Designing Machine Learning Systems: An Iterative Process for Production-Ready Applications, Chip Huyen, June 2022, 386 pages.
- MLOps: Continuous delivery and automation pipelines in machine learning in Google
- Best Practices for ML Engineering in Google
- https://github.com/EthicalML/awesome-production-machine-learning
- https://madewithml.com/
- https://arxiv.org/ftp/arxiv/papers/2205/2205.02302.pdf
- https://github.com/DataTalksClub/mlops-zoomcamp