Soy investigador senior en la Fundación Common Crawl.
Me intereso principalmente en la creación de datasets de gran tamaño para el entrenamiento de modelos de lenguaje, especialmente para idiomas de escasos recursos e idiomas históricos. Estoy interesado en tareas como Reconocimiento de entidades (NER), Análisis de dependencias y etiquetado de parte del discurso, Traducción automática y Estructuración de documentos.
Me encanta el café, las galletas y la programación. ☕🍪
Doctorado en Ciencias de la Computación, 2022
Sorbonne Université
Pregrado MIASHS, 2018
Université Paris 8
Master en Matemáticas, 2017
Aix-Marseille Université
Pregrado en Matemáticas, 2016
Universidad Nacional de Colombia