Appel: SemDis2013, Enjeux actuels de la semantique distributionnelle, Nouvelle date limite de soumission

Tue Mar 26 21:10:31 UTC 2013

Date: Tue, 26 Mar 2013 10:08:08 +0100
From: Nabil Hathout <Nabil.Hathout at univ-tlse2.fr>
Message-ID: <51516578.8050204 at univ-tlse2.fr>
X-url: http://www.taln2013.org/atelier-de-semantique-distributionnelle/

SemDis 2013

APPEL À COMMUNICATIONS

**Extension de la date limite de soumission : 5 avril 2013**

Enjeux actuels de la sémantique distributionnelle

Atelier TALN 2013
20e conférence sur le Traitement Automatique des Langues Naturelles
Sables d’Olonne, 21 juin 2013

CALENDRIER

– Nouvelle date limite de soumission : 5 avril 2013
– Notification aux auteurs : 25 avril 2013
– Date limite de soumission des versions définitives : 6 mai 2013

PRÉSENTATION DU CHAMP / THÉMATIQUES VISÉES

Les techniques d’analyse distributionnelle basées sur le modèle
harrissien sont aujourd’hui largement répandues. Elles sont fondées sur
le principe du calcul de la proximité sémantique entre mots sur la base
des contextes qu’ils partagent dans un corpus donné. Ce principe a donné
lieu à des expérimentations nombreuses, principalement sur l’anglais
mais également sur d’autres langues, et des travaux de synthèse ont
permis récemment de stabiliser les notions et les  procédures relatives
au calcul distributionnel (Sahlgren, 2006 ; Turney et Pantel, 2010 ;
Baroni et Lenci 2010, etc.). Cette approche a bénéficié ces dernières
années de la disponibilité de grandes masses de données textuelles et de
capacités informatiques accrues pour  les traiter,  ce qui a permis
d’exploiter ces méthodes à très grande échelle.

De nombreux champs de recherche restent ouverts dans ce domaine
concernant la construction, la validation et l’exploitation des
ressources sémantiques générées par ces méthodes :

 Du point de vue de la construction des ressources, la question du
 corpus est centrale. S’éloignant des hypothèses harrissiennes initiales
 sur le traitement de corpus spécialisés, la tendance actuelle est à la
 constitution de corpus les plus volumineux possible.  Se pose pourtant
 la question de la nature du corpus, et de son impact sur les
 résultats. Un deuxième sujet important est la modélisation de la
 compositionnalité sémantique dans ce cadre distributionnel, pour
 prendre en compte la combinaison des mots simples dans des unités plus
 grandes (Mitchell et Lapata, 2008 ; Baroni & Zamparelli, 2010 ;
 Grefenstette & Sadrzadeh, 2011). D’autres aspects méthodologiques sont
 également soulevés : l’optimisation des calculs, les types de contextes
 à considérer, l’articulation avec les analyses syntaxiques exploitées,
 etc.

 Du point de vue de l’interprétation, de l’évaluation et de la
 validation des relations, beaucoup reste à faire pour mieux comprendre
 la nature de la proximité sémantique qui est calculée par ces
 techniques et l’impact des paramètres distributionnels sur les
 relations de sens produites (Sahlgren 2006, Peirsman & Geeraerts
 2009). Les relations entre mots s’avèrent en effet très diverses
 (relations lexicales classiques, relations associatives, relations
 d’analogie, etc.). Par ailleurs, la taille des ressources générées les
 rend difficiles à explorer et à appréhender. Des systèmes de
 visualisation et de manipulation graphiques adaptés à leur exploration
 peuvent permettre d’améliorer la connaissance de leur contenu et de
 leur structure.

Concernant enfin l’exploitation des ressources distributionnelles,
celles-ci fournissent un indice de proximité sémantique très précieux
pour différentes applications (recherche d’information, résumé
automatique, segmentation thématique, etc.). De fait des traits
distributionnels sont incorporés dans un nombre croissant de travaux
touchant différentes tâches du TAL (classification d’entités nommées,
calcul de paraphrase, etc.) (Kotlerman et al. 2010 ; Jonnalagadda et
al. 2012). La linguistique gagnerait également à s’approprier plus
largement ces techniques, qui permettent d’étudier à large échelle les
relations de sens qui opèrent dans un corpus.

Nous attendons des soumissions portant sur l’ensemble des thèmes évoqués
ci-dessus et en particulier (liste non exhaustive) :

– construction de ressources distributionnelles
– mesures de similarité sémantique
– impact des corpus sur le traitement distributionnel
– compositionnalité sémantique
– utilisation de bases distributionnelles pour l’analyse linguistique
– repérage de relations sémantiques spécifiques
– exploitation de la proximité distributionnelle dans des tâches de TAL
– optimisation du calcul de similarité sémantique
– visualisation et manipulation graphique des espaces de mots

TYPES DE COMMUNICATIONS

Les articles seront rédigés en français pour les francophones, en
anglais pour ceux qui ne maîtrisent pas le français.  Ils devront suivre
le format de TALN 2013 et comprendront 12 à 14 pages.  Une feuille de
style LaTeX et un modèle Word sont disponibles sur le site web de la
conférence (http://www.taln2013.org/soumettre/).  Les articles retenus
donneront lieu à une présentation de 30 mn, discussion comprise.

CRITÈRES DE SÉLECTION

Les critères de sélection sont les mêmes que ceux définis par TALN 2013
pour les articles de recherche.

MODALITÉS DE SOUMISSION

Les articles, au format pdf, doivent être déposés à l’adresse
https://www.easychair.org/conferences/?conf=semdis2013

COMITÈ D’ORGANISATION

Cécile Fabre        CLLE, Toulouse
Nabil Hathout        CLLE, Toulouse
Philippe Muller        IRIT, Toulouse
Tim Van de Cruys    IRIT, Toulouse

COMITÉ DE PROGRAMME

Stergos Afantenos    IRIT, Toulouse
Yves Bestgen         UCL/CECL, Louvain-La-Neuve
Marie Candito         ALPAGE, Paris
Eric de la Clergerie    ALPAGE, Paris
Cécile Fabre        CLLE, Toulouse
Olivier Ferret        CEA-LIST, Fontenay-aux-Roses
Nabil Hathout        CLLE, Toulouse
Philippe Muller        IRIT, Toulouse
Adeline Nazarenko    LIPN, Paris
Pascale Sébillot    IRISA, Rennes
Ludovic Tanguy        CLLE, Toulouse
Agnès Tutin        LIDILEM, Grenoble
Tim Van de Cruys    IRIT, Toulouse
Virginie Zampa        LIDILEM, Grenoble

CONTACT

mail : Cécile Fabre <cecile.fabre[arobas]univ-tlse2.fr>
mail : Tim Van de Cruys <Tim.Van-De-Cruys[arobas]irit.fr>
Web : http://www.taln2013.org/atelier-de-semantique-distributionnelle/

-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/
-------------------------------------------------------------------------