Aure est responsable de ces deux projets qui ont pour but le formatage en XML (norme TEI-P5) des données du Congrès.
Aure est responsable de ces deux projets qui ont pour but le formatage en XML (norme TEI-P5) des données du Congrès (lexiques et dictionnaires monolingues et bilingues, corpus monolingues, bilingues alignés et audios transcrits).
Les données obtenues permettent de développer des outils TAL à base de règles (comme le traducteur automatique Revirada...), d'entraîner ceux utilisant l'intelligence artificielle (synthèse vocale Votz, reconnaissance vocale...), de proposer de nouvelles fonctionnalités pour la consultation en ligne de ces données (plateforme Laboratòri) et de créer de nouvelles ressources de manière automatique ou semi-automatique (lexiques de formes fléchies, dictionnaire des synonymes, des locutions, des rimes...).