Jose R. Zapata

Jose R. Zapata

Data Science Technical Leader
PhD in Tecnologías de la información y las Comunicaciones

Mercado Libre

Data Science Technical Leader en Mercado Libre. Investigador en GIDATIC y Profesor Titular de la facultad de tecnologías de la información y comunicación (TIC), en la Universidad Pontificia Bolivariana (UPB).

Mis intereses son en Ciencia de Datos, , MLOps y tecnologías de la información en audio y musica, que incluye temas como Music information retrieval, Aprendizaje de Maquina (Machine Learning), CI/CD/CT, Análisis de audio y Análisis de datos.

Intereses
  • Ciencia de Datos
  • MLOps
  • Music Information Retrieval
  • Procesamiento de Audio
  • Python
  • Guitarra
Educación
  • PhD in Tecnologías de la información y las Comunicaciones, 2013

    Universitat Pompeu Fabra (UPF), Spain

  • Master en Ingenieria area Telecomunicaciones, 2008

    Universidad Pontificia Bolivariana (UPB), Colombia

  • Ingeniero Electronico, 2002

    Universidad Pontificia Bolivariana (UPB), Colombia

Habilidades

Python

Pandas, Scikit-learn, Numpy, Matplotlib, Plotly, Seaborn, BeautifulSoup, Selenium

Ciencia de Datos

Python, SQL, Pandas, BigQuery

Aprendizaje de Maquina & Deep Learning

Scikit-learn, Pytorch, Machine Learning, NLP, Spacy

MLOps

Kedro, MLflow, Deepchecks, DVC, great expectations

Procesamiento Señales

y Analisis de Frecuencia de señales

Programacion

SQL, Git, CI/CD, Bash, Linux

Blog

En Español

*

Estructura Base para Proyectos de Ciencia de datos

Proceso de creación de una estructura base para proyectos de ciencia de datos con Python, teniendo en cuenta buenas prácticas de desarrollo de software y las herramientas de MLOps.

Album Lofi con Python Version Cero

Album Lofi con Python Version Cero

Generacion automatica musica LoFi y videos con Python utilizando técnicas de inteligencia artificial y procesamiento de audio.

Paso a paso en un Proyecto Machine Learning

Paso a paso en un Proyecto Machine Learning

Checklist y preguntas para realizar un proyecto de machine learning

Visualizacion Datos Coronavirus (COVID19) Mundial con Plotly

Visualizacion Datos Coronavirus (COVID19) Mundial con Plotly

Visualizaciones con Python y Plotly de los datos mundiales del corona virus COVID19

Pyspark con Google Colab

Pyspark con Google Colab

Configuracion de Google Colab para usar pyspark

Tutorial de Produccion de Audio con Reaper

Tutorial de Produccion de Audio con Reaper

Tutorial en Video y material produccion basica de Audio con Reaper

Tips para la Exposición del Proyecto de Grado

Tips para la Exposición del Proyecto de Grado

Tips para crear las diapositivas y para realizar la exposición del anteproyecto del trabajo de grado

Proyectos

Plantilla para Proyectos en Ciencia de datos
Plantilla para proyectos de ciencia de datos con herramientas de desarrollo de software.
Acmus
Proyecto de investigacion para explorar el uso de técnicas de aprendizaje automático para musicología computacional, gestión de archivos de música digital y recuperación de información musical. Dos elementos principales del proyecto son: 1. Énfasis en técnicas de aprendizaje automático semi-supervisadas y no supervisadas que dependen mínimamente de la disponibilidad de datos anotados para una tarea específica. 2. La música tradicional colombiana como foco principal de nuestro estudio.
Acmus
Multifeature Beat tracker
Implementacion en Matlab del Multi Feature Beat Tracker (Information Gain and Regularity),el beat tracker de essentia, mas detalles en Multi-Feature Beat Tracking
Multifeature Beat tracker
Essentia
Essentia es una libreria en C++ de código abierto para análisis de audio y recuperación de información de música basada en audio. Contiene una amplia colección de algoritmos reutilizables que implementan la funcionalidad de entrada / salida de audio, bloques de procesamiento de señal digital estándar, caracterización estadística de datos y un amplio conjunto de descriptores de música espectrales, temporales, tonales y de alto nivel. Más detalles en este articulo
Essentia
SMC Beat tracking Dataset
Este dataset de Beat tracking contiene 217 fragmentos de aproximadamente 40 seg cada uno, de los cuales 19 son fáciles y los 198 restantes son dificiles. Este conjunto de datos ha sido diseñado para técnicas radicalmente nuevas que pueden lidiar con desafiantes situaciones de beat tracking como: acompañamiento suave, tiempo expresivo, cambios de compás, tempo lento, calidad de sonido pobre, etc. Más detalles en Selective Sampling for Beat Tracking Evaluation
SMC Beat tracking Dataset

Publicaciones

Busqueda rapida mediante Filtrar publicaciones.
(2016). Tempo Estimation. In Music Data Analysis: Foundations and Applications (pp. 493-510), Claus Weihs, Dietmar Jannach, Igor Vatolkin, Guenter Rudolph (Eds.), Chapman & Hall/CRC, 2016, ISBN 9781498719568.

DOI

(2014). Multi-Feature Beat Tracking. IEEE/ACM Transactions on Audio, Speech, and Language Processing, Vol. 22, No. 4, P. 816-825.

PDF Citar Código fuente DOI

(2013). Using voice suppression algorithms to improve beat tracking in the presence of highly predominant vocals. IEEE The 38th International Conference on Acoustics, Speech, and Signal Processing , ICASSP 2013, P. 51-55 , Vancouver, Canada.

PDF Datos Diapositivas DOI Conference

(2012). Selective Sampling for Beat Tracking Evaluation. IEEE Transactions on Audio, Speech and Language Processing, Vol. 20, No. 9, P. 2539-2548.

PDF Citar Datos DOI

(2012). Assigning a confidence threshold on automatic beat annotation in large datasets. 13th International Society for Music Information Retrieval Conference (ISMIR 2012), P.157-162, Porto, Portugal.

PDF Diapositivas DOI

(2012). Improving Beat Tracking in the presence of highly predominant vocals using source separation techniques: Preliminary study. The 9th International Symposium on Computer Music Modeling and Retrieval (CMMR 2012), London, UK.

PDF Datos Conference

(2012). On the automatic identification of difficult examples for beat tracking: towards building new evaluation datasets. IEEE The 37th International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2012), P. 89-92 Kyoto, Japan.

PDF Datos DOI

(2011). Comparative Evaluation and Combination of Audio Tempo Estimation Approaches. 42nd AES International Conference, Semantic Audio (Audio Engineering Society), P.198-207, Ilmenau, Germany..

PDF Datos Poster AES

(2008). Efficient Detection of Exact Redundancies in Audio Signals. Audio Engineering Society Convention 125, Paper = 7504, San Francisco, EE.UU.

PDF AES Conference

(2004). Control de Rango Dinamico en Audio con Logica Difusa. 3ra Conferencia Iberoamericana en Sistemas, Cibernética e Informática CISCI 2004, Orlando, EE.UU.

Conferencias

Cursos

Cursos pasados y presentes en postgrado y pregrado en la Universidad Pontificia Bolivariana (UPB)

PostGradoPregrado
Python para Ciencia de DatosMachine Learning
Mineria de AudioSistemas y Señales
Principios de Procesamiento de ImagenesMinieria de Datos
Procesamiento de AudioPrincipios Audio
Procesamiento de SeñalesAplicaciones de Audio
Principios de TelecomunicacionesTeoria de Comunicaciones y Lab
MatlabAntenas y Lineas de transmision

Experiencia

 
 
 
 
 
Mercado Libre
Data Science Technical Leader
sept. 2021 – Actualmente Medellin - Colombia
 
 
 
 
 
Globant
Data Scientist Sr
dic. 2020 – sept. 2021 Medellin - Colombia
 
 
 
 
 
Universidad Pontificia Bolivariana
Profesor Titular
sept. 2013 – dic. 2021 Medellin - Colombia
 
 
 
 
 
Music Technology Group - Universitat Pompeu Fabra
Phd. Estudiante Doctorado
sept. 2009 – sept. 2013 Barcelona - España
Thesis: Comparative evaluation and combination of automatic rhythm description systems, Directora. Emilia Gomez
 
 
 
 
 
SMC Group - INESC TEC
Pasantia Doctoral
abr. 2011 – jun. 2011 Porto - Portugal
Tutores. Fabien Gouyon, Matthew E.P. Davies
 
 
 
 
 
Universidad Pontificia Bolivariana
Profesor Asistente
jun. 2003 – sept. 2009 Medellin - Colombia