Vandelvira
Desarrollo de recursos lingüísticos y modelos de lenguaje para el español
Grupo de Investigación en Sistemas Inteligentes de Acceso a la Información (SINAI)
Universidad de Jaén • Proyecto ALIA
¿Qué es ALIA?ALIA es la primera infraestructura pública europea de inteligencia artificial en castellano y lenguas cooficiales (catalán/valenciano, euskera y gallego). Es un proyecto pionero que ofrece modelos de lenguaje abiertos y transparentes, financiado con fondos públicos, para reforzar la soberanía tecnológica de España y Europa. Gracias al superordenador MareNostrum 5 y la coordinación del Barcelona Supercomputing Center, ALIA impulsa una IA responsable, accesible y al servicio de la ciudadanía. |
|
El papel de SINAI y el proyecto VandelviraEl Grupo de Investigación SINAI de la Universidad de Jaén desempeña un papel clave en ALIA a través del proyecto Vandelvira, que busca enriquecer el ecosistema con recursos y modelos de lenguaje avanzados en español. El proyecto se centra en la construcción tanto de modelos generativos como de modelos discriminativos (como embeddings), cubriendo tareas diversas como generación de texto, clasificación de documentos o recuperación de información. |
Tres dominios de Vandelvira
🏥 BiosanitarioDesarrollo de conjuntos de datos y modelos para mejorar la comprensión y generación de informes clínicos y biomédicos. | ⚖️ Legal-administrativoRecursos lingüísticos orientados a trámites, documentos jurídicos y administrativos, facilitando el acceso ciudadano a la información pública. | 🏛️ Patrimonial-culturalModelos diseñados para la preservación, difusión y digitalización del patrimonio histórico y cultural. |
Nuestro objetivoEl objetivo principal es facilitar la creación de una nueva generación de recursos y servicios tecnológicos innovadores, construidos sobre el inmenso patrimonio lingüístico del castellano y de las lenguas cooficiales. Queremos que la inteligencia artificial desarrollada en España sea inclusiva, transparente y útil para todos los sectores, apostando por una IA confiable, justa y orientada al beneficio colectivo. | Pública y abiertaALIA es una infraestructura 100% financiada con fondos públicos, lo que garantiza que su desarrollo y sus resultados estén al servicio del interés general. Su carácter abierto asegura la máxima transparencia, permitiendo que la comunidad investigadora pueda auditar y mejorar los modelos, que las empresas innoven y que la ciudadanía confíe en herramientas responsables. |
ALIA Kit
ALIA Kit es el espacio de acceso a todos los recursos lingüísticos: modelos de lenguaje y multimodales, metodologías, documentación y conjuntos de datos de entrenamiento y evaluación.
Es la puerta de entrada a todo el ecosistema ALIA y un entorno diseñado para facilitar tanto la investigación como la aplicación práctica de la IA en múltiples sectores.
Accede a todos los recursos del proyecto:
Documentación, modelos y datasets disponibles