Jose R. Zapata

Jose R. Zapata

Data Science Technical Leader
PhD in Tecnologías de la información y las Comunicaciones

Mercado Libre

Data Science Technical Leader en Mercado Libre. Investigador en GIDATIC y Profesor Titular de la facultad de tecnologías de la información y comunicación (TIC), en la Universidad Pontificia Bolivariana (UPB).

Mis intereses son en Ciencia de Datos, , MLOps y tecnologías de la información en audio y musica, que incluye temas como Music information retrieval, Aprendizaje de Maquina (Machine Learning), CI/CD/CT, Análisis de audio y Análisis de datos.

Intereses
  • Ciencia de Datos
  • MLOps
  • Music Information Retrieval
  • Procesamiento de Audio
  • Python
  • Guitarra
Educación
  • PhD in Tecnologías de la información y las Comunicaciones, 2013

    Universitat Pompeu Fabra (UPF), Spain

  • Master en Ingenieria area Telecomunicaciones, 2008

    Universidad Pontificia Bolivariana (UPB), Colombia

  • Ingeniero Electronico, 2002

    Universidad Pontificia Bolivariana (UPB), Colombia

Habilidades

Python

Pandas, Polars, Numpy, Matplotlib, Plotly, Seaborn

Ciencia de Datos

Python, SQL, Pandas, Polars, BigQuery

Machine Learning & DL

Deep Learning, Scikit-learn, Pytorch, NLP, Spacy

MLOps

Kedro, MLflow, Deepchecks, DVC, great expectations

Procesamiento de señales

y Análisis de Frecuencia de señales

Programación

Git, CI/CD, Bash, pre-commit, Linux

Blog

En Español

*

Estructura Base para Proyectos de Ciencia de datos

Proceso de creación de una estructura base para proyectos de ciencia de datos con Python, teniendo en cuenta buenas prácticas de desarrollo de software y las herramientas de MLOps.

Album Lofi con Python Version Cero

Album Lofi con Python Version Cero

Generacion automatica musica LoFi y videos con Python utilizando técnicas de inteligencia artificial y procesamiento de audio.

Paso a paso en un Proyecto Machine Learning

Paso a paso en un Proyecto Machine Learning

Checklist y preguntas para realizar un proyecto de machine learning

Visualizacion Datos Coronavirus (COVID19) Mundial con Plotly

Visualizacion Datos Coronavirus (COVID19) Mundial con Plotly

Visualizaciones con Python y Plotly de los datos mundiales del corona virus COVID19

Pyspark con Google Colab

Pyspark con Google Colab

Configuracion de Google Colab para usar pyspark

Tutorial de Produccion de Audio con Reaper

Tutorial de Produccion de Audio con Reaper

Tutorial en Video y material produccion basica de Audio con Reaper

Tips para la Exposición del Proyecto de Grado

Tips para la Exposición del Proyecto de Grado

Tips para crear las diapositivas y para realizar la exposición del anteproyecto del trabajo de grado

Proyectos

Plantilla para Proyectos en Ciencia de datos
Plantilla para proyectos de ciencia de datos con herramientas de desarrollo de software.
Social Media Behaviour con datos exclusivos de Facebook
Proyecto de investigación en Análisis de Datos que combina datos exclusivos de Facebook (Condor Dataset, Crowdtangle, Ad’s) y datos públicos para analizar el comportamiento de las redes sociales para determinar si existe un comportamiento no auténtico coordinado. Este proyecto es financiado por las Becas Social Media and Democracy Research Grants del Social Science Research Council y acceso a los datos de Facebook a través de Social Science One.
Social Media Behaviour con datos exclusivos de Facebook
Acmus
Proyecto de investigacion para explorar el uso de técnicas de aprendizaje automático para musicología computacional, gestión de archivos de música digital y recuperación de información musical. Dos elementos principales del proyecto son: 1. Énfasis en técnicas de aprendizaje automático semi-supervisadas y no supervisadas que dependen mínimamente de la disponibilidad de datos anotados para una tarea específica. 2. La música tradicional colombiana como foco principal de nuestro estudio.
Acmus
Multifeature Beat tracker
Implementacion en Matlab del Multi Feature Beat Tracker (Information Gain and Regularity),el beat tracker de essentia, mas detalles en Multi-Feature Beat Tracking
Multifeature Beat tracker
Essentia
Essentia es una libreria en C++ de código abierto para análisis de audio y recuperación de información de música basada en audio. Contiene una amplia colección de algoritmos reutilizables que implementan la funcionalidad de entrada / salida de audio, bloques de procesamiento de señal digital estándar, caracterización estadística de datos y un amplio conjunto de descriptores de música espectrales, temporales, tonales y de alto nivel. Más detalles en este articulo
Essentia
SMC Beat tracking Dataset
Este dataset de Beat tracking contiene 217 fragmentos de aproximadamente 40 seg cada uno, de los cuales 19 son fáciles y los 198 restantes son dificiles. Este conjunto de datos ha sido diseñado para técnicas radicalmente nuevas que pueden lidiar con desafiantes situaciones de beat tracking como: acompañamiento suave, tiempo expresivo, cambios de compás, tempo lento, calidad de sonido pobre, etc. Más detalles en Selective Sampling for Beat Tracking Evaluation
SMC Beat tracking Dataset

Conferencias

Cursos

Cursos pasados y presentes en postgrado y pregrado en la Universidad Pontificia Bolivariana (UPB)

Post GradoPre grado
Python para Ciencia de DatosMachine Learning
Minería de AudioSistemas y Señales
R para Ciencia de DatosMinería de Datos
Procesamiento de AudioPrincipios Audio
Procesamiento de SeñalesAplicaciones de Audio
Principios de TelecomunicacionesTeoría de Comunicaciones y Lab
MatlabAntenas y Lineas de transmisión

Experiencia

 
 
 
 
 
Mercado Libre
Data Science Technical Leader
septiembre 2021 – Actualmente Medellin - Colombia
 
 
 
 
 
Globant
Data Scientist Sr
diciembre 2020 – septiembre 2021 Medellin - Colombia
 
 
 
 
 
Universidad Pontificia Bolivariana
Profesor Titular
septiembre 2013 – diciembre 2021 Medellin - Colombia
 
 
 
 
 
Music Technology Group - Universitat Pompeu Fabra
Phd. Estudiante Doctorado
septiembre 2009 – septiembre 2013 Barcelona - Spain
Thesis: Comparative evaluation and combination of automatic rhythm description systems, advisor. Emilia Gomez
 
 
 
 
 
SMC Group - INESC TEC
Pasantía Doctoral
abril 2011 – junio 2011 Porto - Portugal
Advisor. Fabien Gouyon, Matthew E.P. Davies
 
 
 
 
 
Universidad Pontificia Bolivariana
Profesor Asistente
junio 2003 – septiembre 2009 Medellin - Colombia