Franck Sajous

  • Ingénieur de recherche CNRS à CLLE
  • Chargé de cours au département Sciences du Langage de l'Université de Toulouse 2
  • Membre du réseau ReLCO (Recherche en lexicographie collaborative)
  • Membre de l'action COST ENEOLI (European Network On Lexical Innovation)
Franck Sajous

Ressources linguistiques développées

Les ressources linguistiques développées à CLLE sont disponibles sur le portail REDAC

DiCo
DIVAE
Portail REDAC : ressource linguistiques développées à CLLE
DiCo (Dictionnaires Comparés) recense les changements intervenus dans la macrostructure des différentes éditions de quatre dictionnaires (Académie, Hachette, Larousse, Robert)
DIVAE (Diatopic Variation of English) est un lexique de mots utilisés dans 74 zones (pays ou régions) anglophones, extrait de ENGLAW.
WIND (Wiktionary INclusion Dates) contient les dates d'entrée des mots vedettes de Wiktionary et Wiktionnaire dans leur nomenclature.
G-PeTo (GLAWI Perl Tools) est une suite de programmes permettant l'exploitation des dictionnaires électroniques GLAWI et GLAW-IT.
FOULOPHONIE est un lexique de la francophonie (148 régions et pays francophones) écrit par les foules.
GLAWI, GLAW-IT et ENGLAWI sont des dictionnaires électroniques libres résutants de la normalisation et de la conversion en XML des éditions française, italienne et anglaise de Wiktionary.
GLÀFF, GLÀFF-IT et ENGLÀFF sont des lexiques flexionnels et phonologiques libres construits à partir des éditions française, italienne et anglaise de Wiktionary.
PsychoGLÀFF est une version de GLÀFF orientée vers la psycholinguistique.
GLÀFFOLI est une interface d'interrogation de GLÀFF
WiktionaryX regroupe les versions française et anglaise du dictionnaire Wiktionary mis au format XML.
WISIGOTH vise la production de ressources lexicales sémantiques en proposant une méthode d'enrichissement endogène semi-automatique du dictionnaire en ligne Wiktionary. Cette méthode est basée sur une validation « par les foules ».
Les Voisins De Le Monde et Les Voisins De Wikipédia sont des bases lexicales distributionnelles du français construiyes respectivement à partir d'un corpus comprenant l'ensemble des articles du quotidien Le Monde sur une période de 10 ans (1991-2000) et la seconde, à partir d'un corpus comprenant l'ensemble des articles de l'encyclopédie Wikipédia.
Les Voisins D'En Face est une application qui permet de comparer deux bases lexicales distributionnelles du français, issus de deux corpus de 30 millions de mots chacun : les articles du quotidien Le Monde sur une période d'un an (sous-partie de la base Les Voisins De Le Monde) et de 515 romans du 20ème siècle issus de la base Frantext.
LexiMédia2007 permet de suivre l'actualité des élections présidentielles de 2007 semaine après semaine : les articles des journaux Le Monde, Libération et Le Figaro sont analysés en permanence et LexiMédia2007 présente l'évolution au fil des semaines des syntagmes extraits.
Wikipédia FR-TXT est un corpus de 260 millions de mots issu de l'encyclopédie en ligne.