Vetinnova
PORTAL DE REFERENCIA SOBRE I+D+i
EN SANIDAD ANIMAL
 

Área Personal

Acceso al área privada de la web
Búsqueda de texto en la web

fbus

CREA TU PERFIL Grupo de Investigación
Grupo de Investigación
CREA TU PERFIL Empresa
Empresa
CREA TU PERFIL Demandante Empleo
Demandante Empleo

 Beca- Ajuste fino de grandes modelos de lenguaje para resultados contextualizados - Departamento de integración de datos

Se busca un/a profesional en formación para desarrollar un proyecto de tesis centrado en la adaptación y ajuste fino de modelos de lenguaje (LLM) aplicados a tareas de traducción, resumen y generación de textos técnicos. La persona seleccionada trabajará en el Departamento de Integración de Datos, en estrecha colaboración con equipos científicos, de traducción y edición, con el objetivo de integrar glosarios, guías de estilo y ejemplos previos en flujos de trabajo reproducibles y mantenibles.

Misiones y actividades principales

  • Recopilación de datos
    • Colaborar con editores y lingüistas para obtener glosarios, guías de estilo y traducciones previas.
    • Definir tareas objetivo y criterios de aceptación (precisión terminológica, fidelidad, estilo, reducción de edición manual).
  • Diseño de estrategias de adaptación
    • Analizar enfoques: ajuste fino en la nube, prompting, adaptación local (LoRA/QLoRA).
    • Proponer 2–3 estrategias según contexto: nube completa, local ligera o híbrida.
  • Preparación de datos y herramientas
    • Crear datasets de entrenamiento/validación en formatos requeridos (JSONL, JSON, LoRA).
    • Desarrollar scripts reproducibles en R y/o Python para tokenización, conversión de formatos y ejecución de ajustes.
  • Implementación y experimentación
    • Ejecutar experimentos controlados con al menos dos enfoques.
    • Evaluar resultados con métricas cuantitativas (BLEU, ChrF) y revisión cualitativa de editores.
  • Evaluación de costos y operación
    • Documentar costos estimados de ajuste fino en la nube.
    • Analizar implicaciones operativas: ubicación de cómputo, gestión de datos, velocidad y sostenibilidad.
    • Entregar flujos de trabajo detallados, código comentado e instrucciones operativas.
    • Producir informe técnico, cuadernos reproducibles y resumen ejecutivo.
  • Diseño e implementación de GUI
    • Desarrollar prototipo en Dash o RShiny para cargar textos, seleccionar modelos y comparar resultados.
    • Garantizar que sea ligero, fácil de desplegar y mantenible por el personal del DID.

Requisitos

  • Formación
    • Máster en ciencia de datos o equivalente.
    • Alternativamente, ciencias veterinarias, de la vida, salud pública, agrícolas o asuntos internacionales con experiencia en ciencia de datos.
  • Habilidades técnicas
    • Nivel avanzado en R o Python.
    • Conocimiento básico de ajuste fino de LLM (deseable).
    • Análisis de datos y resolución de problemas.
    • Buen manejo de Microsoft Office.
    • Excelente inglés (oral y escrito).
    • Conocimientos básicos de epidemiología e inteligencia epidémica.
  • Habilidades interpersonales
    • Trabajo ágil y cumplimiento de plazos.
    • Organización y capacidad de coordinación.
    • Trabajo en equipo y compromiso con el desarrollo del Observatorio.

Más

· Nombre de contacto OMSA
· Plazo de solicitud 05/01/2026
· Entidad Organización Mundial de Sanidad Animal (OMSA)
Una iniciativa de

Vet + i
Vetdivulga
Ayuda PTR2024-002951 financiada por

UNION EUROPEA - FONDO EUROPEO DE DESARROLLO REGIONAL