Appel: Atelier TALN SemDis2013, enjeux actuels de la semantique distributionnelle

Sat Feb 9 20:36:41 UTC 2013

Date: Sat, 9 Feb 2013 13:58:45 +0100
From: Cécile Fabre <cecile.fabre at univ-tlse2.fr>
Message-ID: <CALdwDrh0xjgMC8EHrdp55r4uT9Q-k9kbP9eiQr2Q=qkn-5jDtw at mail.gmail.com>
X-url: http://www.taln2013.org/atelier-de-semantique-distributionnelle/

APPEL À COMMUNICATIONS

Enjeux actuels de la sémantique distributionnelle

Atelier TALN 2013
20e conférence sur le Traitement Automatique des Langues Naturelles

Sables d’Olonne, 21 juin 2013

CALENDRIER

- Date limite de soumission : 29 mars 2013
- Notification aux auteurs : 19 avril 2013
- Date limite de soumission des versions définitives : 3 mai 2013

PRÉSENTATION DU CHAMP / THÉMATIQUES VISÉES

Les techniques d’analyse distributionnelle basées sur le modèle
harrissien sont aujourd’hui largement répandues. Elles sont fondées sur
le principe du calcul de la proximité sémantique entre mots sur la base
des contextes qu’ils partagent dans un corpus donné. Ce principe a donné
lieu à des expérimentations nombreuses, principalement sur l’anglais
mais également sur d’autres langues, et des travaux de synthèse ont
permis récemment de stabiliser les notions et les procédures relatives
au calcul distributionnel (Sahlgren, 2006 ; Turney et Pantel, 2010 ;
Baroni et Lenci 2010, etc.). Cette approche a bénéficié ces dernières
années de la disponibilité de grandes masses de données textuelles et de
capacités informatiques accrues pour les traiter, ce qui a permis
d’exploiter ces méthodes à très grande échelle.

De nombreux champs de recherche restent ouverts dans ce domaine
concernant la construction, la validation et l’exploitation des
ressources sémantiques générées par ces méthodes :

Du point de vue de la construction des ressources, la question du corpus
est centrale. S’éloignant des hypothèses harrissiennes initiales sur le
traitement de corpus spécialisés, la tendance actuelle est à la
constitution de corpus les plus volumineux possible.  Se pose pourtant
la question de la nature du corpus, et de son impact sur les
résultats. Un deuxième sujet important est la modélisation de la
compositionnalité sémantique dans ce cadre distributionnel, pour prendre
en compte la combinaison des mots simples dans des unités plus grandes
(Mitchell et Lapata, 2008 ; Baroni & Zamparelli, 2010 ; Grefenstette &
Sadrzadeh, 2011). D’autres aspects méthodologiques sont également
soulevés : l’optimisation des calculs, les types de contextes à
considérer, l’articulation avec les analyses syntaxiques exploitées,
etc.

Du point de vue de l’interprétation, de l’évaluation et de la validation
des relations, beaucoup reste à faire pour mieux comprendre la nature de
la proximité sémantique qui est calculée par ces techniques et l’impact
des paramètres distributionnels sur les relations de sens produites
(Sahlgren 2006, Peirsman & Geeraerts 2009). Les relations entre mots
s’avèrent en effet très diverses (relations lexicales classiques,
relations associatives, relations d’analogie, etc.). Par ailleurs, la
taille des ressources générées les rend difficiles à explorer et à
appréhender. Des systèmes de visualisation et de manipulation graphiques
adaptés à leur exploration peuvent permettre d’améliorer la connaissance
de leur contenu et de leur structure.

Concernant enfin l’exploitation des ressources distributionnelles,
celles-ci fournissent un indice de proximité sémantique très précieux
pour différentes applications (recherche d’information, résumé
automatique, segmentation thématique, etc.). De fait des traits
distributionnels sont incorporés dans un nombre croissant de travaux
touchant différentes tâches du TAL (classification d’entités nommées,
calcul de paraphrase, etc.)  (Kotlerman et al. 2010 ; Jonnalagadda et
al. 2012). La linguistique gagnerait également à s’approprier plus
largement ces techniques, qui permettent d’étudier à large échelle les
relations de sens qui opèrent dans un corpus.

Nous attendons des soumissions portant sur l’ensemble des thèmes évoqués
ci-dessus et en particulier (liste non exhaustive) :

- construction de ressources distributionnelles
- mesures de similarité sémantique
- impact des corpus sur le traitement distributionnel
- compositionnalité sémantique
- utilisation de bases distributionnelles pour l’analyse linguistique
- repérage de relations sémantiques spécifiques
- exploitation de la proximité distributionnelle dans des tâches de TAL
- optimisation du calcul de similarité sémantique
- visualisation et manipulation graphique des espaces de mots

TYPES DE COMMUNICATIONS

Les articles seront rédigés en français pour les francophones, en
anglais pour ceux qui ne maîtrisent pas le français.  Ils devront suivre
le format de TALN 2013 et comprendront 12 à 14 pages.  Une feuille de
style LaTeX et un modèle Word sont disponibles sur le site web de la
conférence ( http://www.taln2013.org/soumettre/).  Les articles retenus
donneront lieu à une présentation de 30 mn, discussion comprise.

CRITÈRES DE SÉLECTION

Les critères de sélection sont les mêmes que ceux définis par TALN 2013
pour les articles de recherche.

MODALITÉS DE SOUMISSION

Les articles, au format pdf, doivent être déposés à l’adresse
https://www.easychair.org/conferences/?conf=semdis2013

COMITE D’ORGANISATION

Cécile Fabre        CLLE, Toulouse
Nabil Hathout        CLLE, Toulouse
Philippe Muller        IRIT, Toulouse
Tim Van de Cruys    IRIT, Toulouse

COMITÉ DE PROGRAMME

Stergos Afantenos    IRIT, Toulouse
Yves Bestgen         UCL/CECL, Louvain-La-Neuve
Marie Candito         ALPAGE, Paris
Eric de la Clergerie    ALPAGE, Paris
Cécile Fabre        CLLE, Toulouse
Olivier Ferret        CEA-LIST, Fontenay-aux-Roses
Nabil Hathout        CLLE, Toulouse
Philippe Muller        IRIT, Toulouse
Adeline Nazarenko    LIPN, Paris
Pascale Sébillot    IRISA, Rennes
Ludovic Tanguy        CLLE, Toulouse
Agnès Tutin        LIDILEM, Grenoble
Tim Van de Cruys    IRIT, Toulouse
Virginie Zampa        LIDILEM, Grenoble

CONTACT

mail : Cécile Fabre <cecile.fabre[arobas]univ-tlse2.fr>
Web : http://www.taln2013.org/atelier-de-semantique-distributionnelle/

-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/
-------------------------------------------------------------------------