Franck Sajous homepage

Contact
Bureau B508
Université de Toulouse 2
Maison de la Recherche
5, allées Antonio Machado
F-31058 Toulouse Cedex 9
Phone: +33 (0)5 61 50 36 93
E-mail:
(version française)
Sajous

Position
R&D Engineer at CLLE-ERSS Research Unit since 2003, mostly involved in the Natural Language Processing research group's activities.
I am also a lecturer at the Université de Toulouse 2 since 2009.

Activities
Designing tools and resources for NLP, mostly in the following fields:
  • distributional semantics;
  • electronic lexicography;
  • corpora building, annotating and querying;
  • web crawling for harvesting linguistic material;
  • lexical databases building and integrating.

Invited talks
  • Sajous, F. (2017) Les dictionnaires aujourd'hui : par qui, pour qui et pour quoi ? Université de Philologie de Belgrade. 7 March 2017, Belgrade, Serbie.
  • Sajous and Calderone (2016). Crowdsourced dictionaries: leveraging collaborative lexicography for NLP and linguistics. Seminar of the Laboratorio di Linguistica "Giovanni Nencioni" - Scuola Normale Superiore. 29 June 2016. Pisa, Italy.
  • Sajous (2016). 3 talks at the Université de Lille 3, 14 and 15 March 2016. Lille, France.
    • Ressources lexicales pour le TAL et la linguistique : de Princeton WordNet à Babelnet
    • Wiktionary, Wiktionnaire, Wikizionario, Wikiwörterbuch et autres wiktionaries
    • Exploitation du Wiktionnaire : de WiktionaryX à GLAWI en passant par GLÀFF (et quelques autes)
  • Sajous (2015). De GLÀFF à GLAWI et retour... d'expérience sur 6 ans d'exploitation du Wiktionnaire. Journée ConSciLa "Dictionnaires électroniques et morphologie flexionnelle du français contemporain : état des lieux et perspectives", 2 October 2015. Paris, France.
  • Sajous (2007). Construction et exploitation de ressources lexicales en aval de l'analyse syntaxique. Seminar of the Lidilem lab. 14 December 2007. Grenoble, France.


Publications
  • B. Calderone, M. Pascoli, F. Sajous and N. Hathout. (2017). Hybrid Method for Stress Prediction Applied to GLAFF-IT, a Large-Scale Italian Lexicon. In: Gracia J., Bond F., McCrae J., Buitelaar P., Chiarcos C., Hellmann S. (eds) Language, Data, and Knowledge. LDK 2017, Lecture Notes in Computer Science, vol 10318, pp. 26-41. Springer, Cham. [ Article ] [ Bibtex ]
  • F. Sajous et N. Hathout. (2017). Informativité, neutralité et point de vue dans une offre dictionnairique hétérogène : vers une complémentarité ?. Revue française de linguistique appliquée, XXII-1, pp. 27-39. [ Article ] [ Bibtex ]
  • B. Calderone, F. Sajous and N. Hathout. (2016). GLAW-IT: A free large Italian dictionary encoded in a fine-grained XML format. 49th Annual Meeting of the Societas Linguistica Europaea (SLE 2016), pp. 46-45, Naples, Italy. [ Abstract ] [ Bibtex ]
  • N. Hathout and F. Sajous. (2016). Wiktionnaire's Wikicode GLAWIfied: a Workable French Machine-Readable Dictionary. Proceedings of the tenth International Conference on Language Resources and Evaluation (LREC 2016), pp. 1369-1376, Portorož, Slovenia. [ Article ] [ Bibtex ]
  • L. Tanguy, F. Sajous et N. Hathout (2015). Évaluation sur mesure de modèles distributionnels sur un corpus spécialisé : comparaison des approches par contextes syntaxiques et par fenêtres graphiques. TAL, 56(2), pp 103-127. [ Article ] [ Bibtex ].
  • F. Sajous and N. Hathout. (2015). GLAWI, a free XML-encoded Machine-Readable Dictionary built from the French Wiktionary. Proceedings of eLex 2015 conference, pp. 405-426, Herstmonceux, England. [ Article ] [ Bibtex ]
  • N. Hathout, F. Sajous and B. Calderone. (2014). Acquisition and enrichment of morphological and morphosemantic knowledge from the French Wiktionary. Proceedings of Workshop on Lexical and Grammatical Resources for Language Processing, pp. 65-74, Dublin, Ireland. [ Article ] [ Bibtex ]
  • F. Sajous, N. Hathout et B. Calderone. (2014). Ne jetons pas le Wiktionnaire avec l'oripeau du Web ! Études et réalisations fondées sur le dictionnaire collaboratif. Actes du 4e Congrès Mondial de Linguistique Française (CMLF 2014), pp. 663-680, Berlin, Allemagne. [ Article ] [ Bibtex ]
  • B. Calderone, N. Hathout and F. Sajous. (2014). From GLÀFF to PsychoGLÀFF: a large psycholinguistics-oriented French lexical resource. Proceedings of the 16th EURALEX International Congress, pp. 431-446, Bolzano, Italy. [ Article ] [ Bibtex ]
  • C. Fabre, N. Hathout, F. Sajous et L. Tanguy. (2014). Ajuster l'analyse distributionnelle à un corpus spécialisé de petite taille. Actes de l'atelier SemDis 2014, 21e Conférence sur le Traitement Automatique des Langues Naturelles (TALN 2014). pp. 266-279, Marseille. [ Article ] [ Bibtex ]
  • C. Fabre, N. Hathout, L.-M. Ho-Dac, F. Morlane-Hondère, P. Muller, F. Sajous, L. Tanguy, et T. Van de Cruys (2014). Présentation de l'atelier SemDis 2014 : sémantique distributionnelle pour la substitution lexicale et l'exploration de corpus spécialisés. Actes de l'atelier SemDis 2014, 21e Conférence sur le Traitement Automatique des Langues Naturelles (TALN 2014). pp. 196-205, Marseille. [ Article ] [ Bibtex ]
  • N. Hathout, F. Sajous and B. Calderone. (2014). GLÀFF, a Large Versatile French Lexicon. Proceedings of the Ninth International Conference on Language Resources and Evaluation (LREC'14), pp. 1007-1012, Reykjavik, Iceland. [ Article ] [ Bibtex ]
  • F. Sajous, E. Navarro, B. Gaume, L. Prévot and Y. Chudy (2013). Semi-Automatic Enrichment of Crowdsourced Synonymy Networks: The WISIGOTH system applied to Wiktionary. Language Resources & Evaluation, 47(1), pp. 63-96.Article ] [ Bibtex ]
    Published online: 5 November 2011. The original publication is available from www.springerlink.com.
  • F. Sajous, N. Hathout et B. Calderone. (2013). GLÀFF, un Gros Lexique À tout Faire du Français. Actes de la conférence Traitement Automatique des Langues Naturelles (TALN 2013), pp. 285-298, Les Sables d'Olonne, France. [ Article ] [ Bibtex ]
  • L. Tanguy, F. Sajous, B. Calderone and N. Hathout (2012). Authorship Attribution: Using Rich Linguistic Features when Training Data is Scarce. Notebook for PAN at CLEF 2012, Rome, Italy. [ Article ] [ Bibtex ]
  • F. Sajous, E. Navarro et B. Gaume (2011). Enrichissement de lexiques sémantiques approvisionnés par les foules : le système WISIGOTH appliqué à Wiktionary. TAL, 52(1), pp 11-35. [ Article ] [ Bibtex ]
  • L. Tanguy, A. Urieli, B. Calderone, N. Hathout and F. Sajous (2011). A multitude of linguistically-rich features for authorship attribution. Notebook for PAN at CLEF 2011, Amsterdam, Netherlands. [ Article ] [ Bibtex ]
  • F. Sajous, E. Navarro, B. Gaume, L. Prévot, Y. Chudy (2010). Semi-automatic Endogenous Enrichment of Collaboratively Constructed Lexical Resources: Piggybacking onto Wiktionary. In H. Loftsson, E. Rögnvaldsson, S. Helgadóttir (Eds.): Advances in Natural Language Processing, Lecture Notes in Computer Science, vol 6233, Springer Berlin/Heidelberg, pp 332-344. [ Paper ] [ Bibtex ]
    The original publication is available from www.springerlink.com.
  • N. Hathout, F. Sajous and L. Tanguy (2009). Looking for French deverbal nouns in an evolving Web (a short history of WAC). In Proceedings WAC5: 5th Workshop on Web As Corpus, pp. 37-44, San Sebastian, Spain. [ Paper ] [ Bibtex ]
  • E. Navarro, F. Sajous, B. Gaume, L. Prévot, S. Hsieh, I. Kuo, P. Magistry and Chu-Ren Huang (2009). Wiktionary and NLP: Improving synonymy networks. In Proceedings of the ACL-IJCNLP Workshop on The People's Web Meets NLP: Collaboratively Constructed Semantic Resources, pp. 19-27, Singapore. [ Paper ] [ Slides ] [ Dataset ] [ Bibtex ]
  • F. Sajous et L. Tanguy (2006). Repérage de créations lexicales sur le Web francophone, Journée d'étude de l'ATALA Le Web comme ressource pour le TAL, Paris. [ Paper ] [ Bibtex ]


Tools and resources
Most of the tools and linguistic resources developped at CLLE-ERSS are freely available from the REDAC website.

Teaching activities
I teach Computer Science for Natural Language Processing and Linguistics at the Sciences du Langage Department. The topics include lexicography, POS-tagging, XML/XSLT technologies, HTML (parsing and generating), object-oriented modeling (UML) and programming (Java), GUI design.

LinkedIn CV ]