Ressources linguistiques développées
FOULOPHONIE GLAWI GLAW-IT GLAFF GLAFF-IT
G-PeTo (GLAWI Perl Tools) est une suite de programmes permettant l'exploitation des dictionnaires électriques GLAWI et GLAW-IT. FOULOPHONIE est un lexique de la francophonie (148 régions et pays francophones) écrit par les foules. GLAWI et GLAW-IT sont deux dictionnaires électroniques libres du français et de l'italien résutants de la normalisation et de la conversion en XML du Wiktionnaire et de Wikizionario. GLÀFF et GLÀFF-IT sont deux lexiques flexionnels et phonologiques à large couverture du français et de l'italien construits à partir du Wiktionnaire et de Wikizionario.
PsychoGLAFF GLAFFOLI Wiktionary<X/> Wisigoth
PsychoGLÀFF est une version de GLÀFF orientée vers la psycholinguistique. GLÀFFOLI est une interface d'interrogation de GLÀFF WiktionaryX regroupe les versions française et anglaise du dictionnaire Wiktionary mis au format XML. WISIGOTH vise la production de ressources lexicales sémantiques en proposant une méthode d'enrichissement endogène semi-automatique du dictionnaire en ligne Wiktionary. Cette méthode est basée sur une validation « par les foules ».
Les Voisins De Le MondeLes Voisins De Wikipédia Les Voisins D'En Face LexiMédia2007 Wikipédia FR-TXT
Les Voisins De Le Monde et Les Voisins De Wikipédia sont des bases lexicales distributionnelles du français construiyes respectivement à partir d'un corpus comprenant l'ensemble des articles du quotidien Le Monde sur une période de 10 ans (1991-2000) et la seconde, à partir d'un corpus comprenant l'ensemble des articles de l'encyclopédie Wikipédia. Les Voisins D'En Face est une application qui permet de comparer deux bases lexicales distributionnelles du français, issus de deux corpus de 30 millions de mots chacun : les articles du quotidien Le Monde sur une période d'un an (sous-partie de la base Les Voisins De Le Monde) et de 515 romans du 20ème siècle issus de la base Frantext. LexiMédia2007 permet de suivre l'actualité des élections présidentielles de 2007 semaine après semaine : les articles des journaux Le Monde, Libération et Le Figaro sont analysés en permanence et LexiMédia2007 présente l'évolution au fil des semaines des syntagmes extraits. Wikipédia FR-TXT est un corpus de 260 millions de mots issu de l'encyclopédie en ligne.
Les ressources linguistiques développées à CLLE-ERSS
sont disponibles sur le portail REDAC.
Portail REDAC : ressource linguistiques développées à CLLE-ERSS