Appel: Atelier SemDis2014, pre-annonce
Thierry Hamon
thierry.hamon at UNIV-PARIS13.FR
Sat Oct 19 12:55:09 UTC 2013
Date: Thu, 17 Oct 2013 17:52:01 +0200
From: Cécile Fabre <cecile.fabre at univ-tlse2.fr>
Message-ID: <526007A1.50708 at univ-tlse2.fr>
Projet d'organisation de l'atelier SemDis2014 (Sémantique Distributionnelle)
Les équipes CLLE-ERSS et IRIT-MELODI (Toulouse), organisatrices de
l'atelier SemDis 2013 dans le cadre de la conférence TALN ont
l'intention d'organiser une 2ème édition de l'atelier pendant TALN 2014
(sous réserve de l'acceptation par le comité de programme de TALN).
Cette année, l'appel à communication sera complété par l'organisation de
2 tâches :
1) une tâche partagée de substitution lexicale
But : trouver un substitut correct pour un mot dans une phrase
donnée. Cette tâche sera une adaptation au français de la tâche «
SemEval-2007 Task 10: English Lexical Substitution Task » définie par
McCarthy et Navigli. Le corpus sera FRWaC.
2) une tâche exploratoire sur un corpus spécialisé, le corpus TALN
(2007-2013), rassemblé par Florian Boudin (LINA) et mis à disposition
par l'ATALA.
But : appliquer sur ce corpus des techniques de sémantique
distributionnelle laissées au libre choix des participants, permettant
l'échange et la comparaison des traitements, des annotations et des
analyses sur des données communes et familières à tous les
participants. Une liste de mots sera suggérée pour inviter les
participants à focaliser leurs analyses sur des exemples partagés.
La décision d'organiser deux tâches complémentaires est motivée par
l'intérêt de comparer les méthodes dans deux contextes différents :
- une analyse sur très grand corpus visant à faire émerger des
fonctionnements sémantiques à large échelle ;
- une analyse sur corpus spécialisé visant à étudier l'organisation
terminologique et conceptuelle d'un domaine particulier. Ces deux
approches ne soulèvent pas les mêmes questions méthodologiques du fait
des différences dans la taille des corpus, les modes d'évaluation des
résultats et leur utilisation. Il nous semble par conséquent
intéressant de les confronter dans le cadre de l'atelier.
Calendrier indicatif :
(sous réserve de l'acceptation par le comité de programme TALN et à
préciser en fonction du calendrier de la conférence)
- novembre : descriptif des tâches et diffusion des données (tâche 1 :
jeu d'essai, tâche 2 : corpus + liste de mots)
- 1er février : démarrage de la phase de test pour la tâche 1
- 15 février : réception des runs pour la tâche 1
- mars : diffusion des résultats aux participants pour la tâche 1
- avril : réception des articles
- début juillet : atelier
-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version :
Archives : http://listserv.linguistlist.org/archives/ln.html
http://liste.cines.fr/info/ln
La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion : http://www.atala.org/
ATALA décline toute responsabilité concernant le contenu des
messages diffusés sur la liste LN
-------------------------------------------------------------------------
More information about the Ln
mailing list