Beca- Ajuste fino de grandes modelos de lenguaje para resultados contextualizados - Departamento de integración de datos
Se busca un/a profesional en formación para desarrollar un proyecto de tesis centrado en la adaptación y ajuste fino de modelos de lenguaje (LLM) aplicados a tareas de traducción, resumen y generación de textos técnicos. La persona seleccionada trabajará en el Departamento de Integración de Datos, en estrecha colaboración con equipos científicos, de traducción y edición, con el objetivo de integrar glosarios, guías de estilo y ejemplos previos en flujos de trabajo reproducibles y mantenibles.
Misiones y actividades principales
- Recopilación de datos
- Colaborar con editores y lingüistas para obtener glosarios, guías de estilo y traducciones previas.
- Definir tareas objetivo y criterios de aceptación (precisión terminológica, fidelidad, estilo, reducción de edición manual).
- Diseño de estrategias de adaptación
- Analizar enfoques: ajuste fino en la nube, prompting, adaptación local (LoRA/QLoRA).
- Proponer 2–3 estrategias según contexto: nube completa, local ligera o híbrida.
- Preparación de datos y herramientas
- Crear datasets de entrenamiento/validación en formatos requeridos (JSONL, JSON, LoRA).
- Desarrollar scripts reproducibles en R y/o Python para tokenización, conversión de formatos y ejecución de ajustes.
- Implementación y experimentación
- Ejecutar experimentos controlados con al menos dos enfoques.
- Evaluar resultados con métricas cuantitativas (BLEU, ChrF) y revisión cualitativa de editores.
- Evaluación de costos y operación
- Documentar costos estimados de ajuste fino en la nube.
- Analizar implicaciones operativas: ubicación de cómputo, gestión de datos, velocidad y sostenibilidad.
- Entregar flujos de trabajo detallados, código comentado e instrucciones operativas.
- Producir informe técnico, cuadernos reproducibles y resumen ejecutivo.
- Diseño e implementación de GUI
- Desarrollar prototipo en Dash o RShiny para cargar textos, seleccionar modelos y comparar resultados.
- Garantizar que sea ligero, fácil de desplegar y mantenible por el personal del DID.
Requisitos
- Formación
- Máster en ciencia de datos o equivalente.
- Alternativamente, ciencias veterinarias, de la vida, salud pública, agrícolas o asuntos internacionales con experiencia en ciencia de datos.
- Habilidades técnicas
- Nivel avanzado en R o Python.
- Conocimiento básico de ajuste fino de LLM (deseable).
- Análisis de datos y resolución de problemas.
- Buen manejo de Microsoft Office.
- Excelente inglés (oral y escrito).
- Conocimientos básicos de epidemiología e inteligencia epidémica.
- Habilidades interpersonales
- Trabajo ágil y cumplimiento de plazos.
- Organización y capacidad de coordinación.
- Trabajo en equipo y compromiso con el desarrollo del Observatorio.
Más
· Nombre de contacto
OMSA
· Plazo de solicitud
05/01/2026
· Entidad
Organización Mundial de Sanidad Animal (OMSA)