Aller au contenu principal

Chaire langages dynamiques orientés données

L'objectif de la chaire est de transformer des données massives en langage compréhensible, pour un traitement optimisé de l’information

THÉMATIQUE

Le volume de données stockées dans le monde ne cesse d’augmenter, que ce soient des données scientifiques, artistiques, médicales, personnelles... Cette masse de données mondiale est distribuée à divers endroits comme les instituts scientifiques, les centres de données d’entreprises et d’administrations publiques, les ordinateurs et téléphones personnels de tout un chacun. Mais à l’état brut, ces données ne représentent pas encore de l’information. Pour être valorisées, elles doivent être traitées, transformées, regroupées pour en extraire du sens.

Les systèmes de gestion des bases de données sont programmés dans des langages spécialisés et complexes tels Java ou SQL. Or les analystes traitent traditionnellement les données sur leurs ordinateurs personnels avec des langages généralistes tels Python ou JavaScript. Doivent-ils se résoudre à utiliser un langage difficile à maîtriser mais permettant le traitement de volumes massifs de données, ou bien utiliser un langage plus accessible, mais sur une fraction seulement des données ? C'est un peu le dilemme qu'on pourrait avoir si en rentrant du travail, on avait une irrésistible envie de fondant au chocolat peu calorifique : vaut-il mieux courir les restaurants, consulter leur carte, voire interroger leur chef cuisinier ou se poster devant le plan d'un village de restaurants et choisir en fonction du peu d'informations indiquées ?

Le but de la chaire est d’éviter un tel dilemme aux analystes et de réunir les deux mondes, en transformant automatiquement les programmes de traitement de données écrits dans un langage généraliste en des programmes spécialisés travaillant au plus proche des données.

KIM NGUYEN, PORTEUR DE LA CHAIRE

Kim Nguyen est Maître de Conférences en Informatique à l'Université Paris-Saclay et membre du Laboratoire de Méthodes Formelles (LMF). Ses domaines d'intérêt portent sur les langages et systèmes centrés données, ainsi que la compilation et optimisation des programmes. Il est également co-auteur d'un ouvrage pédagogique sur les sciences informatiques " Numérique et Sciences Informatiques, 30 leçons avec exercices corrigés " pour les élèves de première – Éditions Ellipses. 

"Exprimer des processus complexes de notre monde de manière rigoureuse et formelle afin qu’une machine puisse les exécuter."
Professeur Kim Nguyen

LE MÉCÈNE

La convention de mécénat a été signée le 30 octobre 2019 et un comité de pilotage s’est tenu dans la foulée pour définir le programme de travail de la 1ère année. Un étudiant de Master et un doctorant vont rejoindre l’équipe de recherche pour définir et développer un prototype de traduction automatique entre les deux types de langage. Ce prototype sera validé sur des jeux de tests et des cas d’utilisation mis à disposition par le mécène.