Ne jetons pas le Wiktionnaire avec l'oripeau du Web ! Études et réalisations fondées sur le dictionnaire collaboratif
Franck Sajous,
Nabil Hathout et
Basilio Calderone
2014
Actes du 4e Congrès Mondial de Linguistique Française (CMLF 2014)
Berlin, Allemagne
663-680
Franck Neveu, Peter Blumenthal, Linda Hriba, Annette Gerstenberg, Judith Meinschaefer et Sophie Prévost
SHS Web of Conferences
10.1051/shsconf/20140801216
978-2-7598-1289-9
[ PDF article ]
F. Sajous, N. Hathout et B. Calderone (2014).
Ne jetons pas le Wiktionnaire avec l'oripeau du Web ! Études et réalisations fondées sur le dictionnaire collaboratif
Actes du 4e Congrès Mondial de Linguistique Française (CMLF 2014),
pp. 663-680, Berlin, Allemagne
[ .bib ]
Wiktionnaire est l'édition française de Wiktionary, le dictionnaire libre multilingue accessible en ligne. Satellite de Wikipédia, dont il constitue le « compagnon lexical », le projet dictionnairique reste dans l'ombre de l'encyclopédie. Fondé comme elle sur le principe du wiki, il peut être alimenté et modifié par tout internaute, avec publication immédiate. Si la ressource encyclopédique a été abondamment utilisée dans certaines disciplines, le dictionnaire collaboratif semble avoir reçu moins d'attention de la part de la communauté scientifique. Ce moindre intérêt pourrait être le fruit d'une méconnaissance ou d'un rejet a priori de l'amateurisme que l'on associe volontiers aux contributions effectuées par des naïfs. Nous présentons dans cet article quelques caractéristiques du Wikionnaire, ainsi que des réalisations issues de cette ressource. Ce travail entend illustrer les possibilités offertes par ce dictionnaire singulier, comment il est possible de l'exploiter et pour quel usage. Plus précisément, nous questionnons la légitimité des ressources « approvisionnées par les foules » et nous étudions dans quelle mesure le Wiktionnaire peut, par ses spécificités, compléter les ressources dictionnairiques existantes dans le cadre d'études linguistiques ciblées et, d'autre part, servir de point de départ à la constitution d'un lexique électronique pour des domaines comme le traitement automatique des langues et la psycholinguistique. Notre contribution à la caractérisation du Wiktionnaire s'accompagne de la mise à disposition de deux lexiques construits à partir du dictionnaire collaboratif :
- le premier est un lexique flexionnel et phonologique à très large couverture. Destiné notamment aux applications de TAL, nous donnons également des exemples d'utilisations de ce lexique en linguistique outillée.
- le second est un lexique orienté vers la psycholinguistique. Dérivé du premier, il contient moins d'entrées, mais comprend pour chacune d'elle un ensemble d'informations habituellement utilisées dans cette discipline.
Ces lexiques sont à la fois téléchargeables librement et interrogeables en ligne.