Présentation de l'atelier SemDis 2014 : sémantique distributionnelle pour la substitution lexicale et l'exploration de corpus spécialisés
Cécile Fabre,
Nabil Hathout,
Lydia-Mai Ho-Dac,
François Morlane-Hondère,
Philippe Muller,
Franck Sajous,
Ludovic Tanguy and
Tim Van de Cruys
2014
Actes de l'atelier SemDis 2014, 21e Conférence sur le Traitement Automatique des Langues Naturelles (TALN 2014)
Marseille, France
266-279
Association pour le Traitement Automatique des Langues
[ PDF article ]
C. Fabre, N. Hathout,
L.-M. Ho-Dac,
F. Morlane-Hondère,
P. Muller,
F. Sajous,
L. Tanguy and
T. Van de Cruys (2014).
Présentation de l'atelier SemDis 2014 : sémantique distributionnelle pour la substitution lexicale et l'exploration de corpus spécialisés.
Actes de l'atelier SemDis 2014, 21e Conférence sur le Traitement Automatique des Langues Naturelles (TALN 2014),
pp. 196-205, Marseille, France.
[ .bib ]
Sémantique distributionnelle, substitution lexicale, tâche partagée, évaluation
Distributional semantics, lexical substitution, shared task, evaluation
Il s'agit d'un article d'introduction aux actes de SemDis 2014, atelier dédié aux méthodes d'analyse sémantique
distributionnelle, avec une focalisation sur la construction de ressources distributionnelles en français. Il décrit
les deux tâches qui ont été proposées dans le cadre de l'atelier : la première est une tâche compétitive de substitution
lexicale, basée sur le corpus FRWAC. La seconde, plus exploratoire, consiste à analyser un corpus spécifique relevant du
champ du TAL. Nous rendons compte de l'évaluation des systèmes qui ont participé à la tâche compétitive, et donnons
un aperçu de la diversité des méthodes qui ont été utilisées par les participants dans les deux tâches.
This is an introductory paper for the proceedings of the SemDis 2014 workshop, dedicated to distributional
semantics methods with a focus on the construction of French distributional resources. We describe the two tasks
that have been set up : the first one is competitive. It is a French lexical substitution task, based on the FRWAC corpus.
The second one is a more exploratory task, which consists in the analysis of a specific corpus in the NLP field. We report
an evaluation of the systems participating in the competitive task, and give a broad overview for both tasks of the diverse
methods that have been used by the participants.