Jose R. Zapata

Jose R. Zapata

Data Science Technical Leader
PhD in Tecnologías de la información y las Comunicaciones

Mercado Libre

Data Science Technical Leader en Mercado Libre. Investigador en GIDATIC y Profesor Titular de la facultad de tecnologías de la información y comunicación (TIC), en la Universidad Pontificia Bolivariana (UPB).

Mis intereses son en Ciencia de Datos, , MLOps y tecnologías de la información en audio y musica, que incluye temas como Music information retrieval, Aprendizaje de Maquina (Machine Learning), CI/CD/CT, Análisis de audio y Análisis de datos.

Intereses
  • Ciencia de Datos
  • MLOps
  • Music Information Retrieval
  • Procesamiento de Audio
  • Python
  • Guitarra
Educación
  • PhD in Tecnologías de la información y las Comunicaciones, 2013

    Universitat Pompeu Fabra (UPF), Spain

  • Master en Ingenieria area Telecomunicaciones, 2008

    Universidad Pontificia Bolivariana (UPB), Colombia

  • Ingeniero Electronico, 2002

    Universidad Pontificia Bolivariana (UPB), Colombia

Habilidades

Python

Pandas, Scikit-learn, Numpy, Matplotlib, Plotly, Seaborn, BeautifulSoup, Selenium

Ciencia de Datos

Python, SQL, Pandas, BigQuery

Aprendizaje de Maquina & Deep Learning

Scikit-learn, Pytorch, Machine Learning, NLP, Spacy

MLOps

Kedro, MLflow, Deepchecks, DVC, great expectations

Procesamiento Señales

y Analisis de Frecuencia de señales

Programacion

SQL, Git, CI/CD, Bash, Linux

Proyectos

Acmus
Proyecto de investigacion para explorar el uso de técnicas de aprendizaje automático para musicología computacional, gestión de archivos de música digital y recuperación de información musical. Dos elementos principales del proyecto son: 1. Énfasis en técnicas de aprendizaje automático semi-supervisadas y no supervisadas que dependen mínimamente de la disponibilidad de datos anotados para una tarea específica. 2. La música tradicional colombiana como foco principal de nuestro estudio.
Multifeature Beat tracker
Implementacion en Matlab del Multi Feature Beat Tracker (Information Gain and Regularity),el beat tracker de essentia, mas detalles en Multi-Feature Beat Tracking
Essentia
Essentia es una libreria en C++ de código abierto para análisis de audio y recuperación de información de música basada en audio. Contiene una amplia colección de algoritmos reutilizables que implementan la funcionalidad de entrada / salida de audio, bloques de procesamiento de señal digital estándar, caracterización estadística de datos y un amplio conjunto de descriptores de música espectrales, temporales, tonales y de alto nivel. Más detalles en este articulo
SMC Beat tracking Dataset
Este dataset de Beat tracking contiene 217 fragmentos de aproximadamente 40 seg cada uno, de los cuales 19 son fáciles y los 198 restantes son dificiles. Este conjunto de datos ha sido diseñado para técnicas radicalmente nuevas que pueden lidiar con desafiantes situaciones de beat tracking como: acompañamiento suave, tiempo expresivo, cambios de compás, tempo lento, calidad de sonido pobre, etc. Más detalles en Selective Sampling for Beat Tracking Evaluation

Publicaciones

Quickly discover relevant content by filtering publications.
(2016). Tempo Estimation. In Music Data Analysis: Foundations and Applications (pp. 493-510), Claus Weihs, Dietmar Jannach, Igor Vatolkin, Guenter Rudolph (Eds.), Chapman & Hall/CRC, 2016, ISBN 9781498719568.

DOI

(2014). Multi-Feature Beat Tracking. IEEE/ACM Transactions on Audio, Speech, and Language Processing, Vol. 22, No. 4, P. 816-825.

PDF Código fuente DOI

(2013). Using voice suppression algorithms to improve beat tracking in the presence of highly predominant vocals. IEEE The 38th International Conference on Acoustics, Speech, and Signal Processing , ICASSP 2013, P. 51-55 , Vancouver, Canada.

PDF Datos Diapositivas DOI Conference

(2012). Selective Sampling for Beat Tracking Evaluation. IEEE Transactions on Audio, Speech and Language Processing, Vol. 20, No. 9, P. 2539-2548.

PDF Datos DOI

(2012). Assigning a confidence threshold on automatic beat annotation in large datasets. 13th International Society for Music Information Retrieval Conference (ISMIR 2012), P.157-162, Porto, Portugal.

PDF Diapositivas DOI

(2011). Comparative Evaluation and Combination of Audio Tempo Estimation Approaches. 42nd AES International Conference, Semantic Audio (Audio Engineering Society), P.198-207, Ilmenau, Germany..

PDF Datos Poster AES

(2008). Efficient Detection of Exact Redundancies in Audio Signals. Audio Engineering Society Convention 125, Paper = 7504, San Francisco, EE.UU.

PDF AES Conference

(2004). Control de Rango Dinamico en Audio con Logica Difusa. 3ra Conferencia Iberoamericana en Sistemas, Cibernética e Informática CISCI 2004, Orlando, EE.UU.

Charlas

Cursos

Cursos pasados y presentes en postgrado y pregrado en la Universidad Pontificia Bolivariana (UPB)

PostGrado Pregrado
Python para Ciencia de Datos Machine Learning
Mineria de Audio Sistemas y Señales
Principios de Procesamiento de Imagenes Minieria de Datos
Procesamiento de Audio Principios Audio
Procesamiento de Señales Aplicaciones de Audio
Principios de Telecomunicaciones Teoria de Comunicaciones y Lab
Matlab Antenas y Lineas de transmision

Experiencia

 
 
 
 
 
Mercado Libre
Data Science Technical Leader
sept. 2021 – Actualmente Medellin - Colombia
 
 
 
 
 
Globant
Data Scientist Sr
dic. 2020 – sept. 2021 Medellin - Colombia
 
 
 
 
 
Universidad Pontificia Bolivariana
Profesor Titular
sept. 2013 – dic. 2021 Medellin - Colombia
 
 
 
 
 
Music Technology Group - Universitat Pompeu Fabra
Phd. Estudiante Doctorado
sept. 2009 – sept. 2013 Barcelona - España
Thesis: Comparative evaluation and combination of automatic rhythm description systems, Directora. Emilia Gomez
 
 
 
 
 
SMC Group - INESC TEC
Pasantia Doctoral
abr. 2011 – jun. 2011 Porto - Portugal
Tutores. Fabien Gouyon, Matthew E.P. Davies
 
 
 
 
 
Universidad Pontificia Bolivariana
Profesor Asistente
jun. 2003 – sept. 2009 Medellin - Colombia