Appel: Atelier TALN SemDis2013, enjeux actuels de la semantique distributionnelle
Thierry Hamon
thierry.hamon at UNIV-PARIS13.FR
Sat Feb 9 20:36:41 UTC 2013
Date: Sat, 9 Feb 2013 13:58:45 +0100
From: Cécile Fabre <cecile.fabre at univ-tlse2.fr>
Message-ID: <CALdwDrh0xjgMC8EHrdp55r4uT9Q-k9kbP9eiQr2Q=qkn-5jDtw at mail.gmail.com>
X-url: http://www.taln2013.org/atelier-de-semantique-distributionnelle/
APPEL À COMMUNICATIONS
Enjeux actuels de la sémantique distributionnelle
Atelier TALN 2013
20e conférence sur le Traitement Automatique des Langues Naturelles
Sables d’Olonne, 21 juin 2013
CALENDRIER
- Date limite de soumission : 29 mars 2013
- Notification aux auteurs : 19 avril 2013
- Date limite de soumission des versions définitives : 3 mai 2013
PRÉSENTATION DU CHAMP / THÉMATIQUES VISÉES
Les techniques d’analyse distributionnelle basées sur le modèle
harrissien sont aujourd’hui largement répandues. Elles sont fondées sur
le principe du calcul de la proximité sémantique entre mots sur la base
des contextes qu’ils partagent dans un corpus donné. Ce principe a donné
lieu à des expérimentations nombreuses, principalement sur l’anglais
mais également sur d’autres langues, et des travaux de synthèse ont
permis récemment de stabiliser les notions et les procédures relatives
au calcul distributionnel (Sahlgren, 2006 ; Turney et Pantel, 2010 ;
Baroni et Lenci 2010, etc.). Cette approche a bénéficié ces dernières
années de la disponibilité de grandes masses de données textuelles et de
capacités informatiques accrues pour les traiter, ce qui a permis
d’exploiter ces méthodes à très grande échelle.
De nombreux champs de recherche restent ouverts dans ce domaine
concernant la construction, la validation et l’exploitation des
ressources sémantiques générées par ces méthodes :
Du point de vue de la construction des ressources, la question du corpus
est centrale. S’éloignant des hypothèses harrissiennes initiales sur le
traitement de corpus spécialisés, la tendance actuelle est à la
constitution de corpus les plus volumineux possible. Se pose pourtant
la question de la nature du corpus, et de son impact sur les
résultats. Un deuxième sujet important est la modélisation de la
compositionnalité sémantique dans ce cadre distributionnel, pour prendre
en compte la combinaison des mots simples dans des unités plus grandes
(Mitchell et Lapata, 2008 ; Baroni & Zamparelli, 2010 ; Grefenstette &
Sadrzadeh, 2011). D’autres aspects méthodologiques sont également
soulevés : l’optimisation des calculs, les types de contextes à
considérer, l’articulation avec les analyses syntaxiques exploitées,
etc.
Du point de vue de l’interprétation, de l’évaluation et de la validation
des relations, beaucoup reste à faire pour mieux comprendre la nature de
la proximité sémantique qui est calculée par ces techniques et l’impact
des paramètres distributionnels sur les relations de sens produites
(Sahlgren 2006, Peirsman & Geeraerts 2009). Les relations entre mots
s’avèrent en effet très diverses (relations lexicales classiques,
relations associatives, relations d’analogie, etc.). Par ailleurs, la
taille des ressources générées les rend difficiles à explorer et à
appréhender. Des systèmes de visualisation et de manipulation graphiques
adaptés à leur exploration peuvent permettre d’améliorer la connaissance
de leur contenu et de leur structure.
Concernant enfin l’exploitation des ressources distributionnelles,
celles-ci fournissent un indice de proximité sémantique très précieux
pour différentes applications (recherche d’information, résumé
automatique, segmentation thématique, etc.). De fait des traits
distributionnels sont incorporés dans un nombre croissant de travaux
touchant différentes tâches du TAL (classification d’entités nommées,
calcul de paraphrase, etc.) (Kotlerman et al. 2010 ; Jonnalagadda et
al. 2012). La linguistique gagnerait également à s’approprier plus
largement ces techniques, qui permettent d’étudier à large échelle les
relations de sens qui opèrent dans un corpus.
Nous attendons des soumissions portant sur l’ensemble des thèmes évoqués
ci-dessus et en particulier (liste non exhaustive) :
- construction de ressources distributionnelles
- mesures de similarité sémantique
- impact des corpus sur le traitement distributionnel
- compositionnalité sémantique
- utilisation de bases distributionnelles pour l’analyse linguistique
- repérage de relations sémantiques spécifiques
- exploitation de la proximité distributionnelle dans des tâches de TAL
- optimisation du calcul de similarité sémantique
- visualisation et manipulation graphique des espaces de mots
TYPES DE COMMUNICATIONS
Les articles seront rédigés en français pour les francophones, en
anglais pour ceux qui ne maîtrisent pas le français. Ils devront suivre
le format de TALN 2013 et comprendront 12 à 14 pages. Une feuille de
style LaTeX et un modèle Word sont disponibles sur le site web de la
conférence ( http://www.taln2013.org/soumettre/). Les articles retenus
donneront lieu à une présentation de 30 mn, discussion comprise.
CRITÈRES DE SÉLECTION
Les critères de sélection sont les mêmes que ceux définis par TALN 2013
pour les articles de recherche.
MODALITÉS DE SOUMISSION
Les articles, au format pdf, doivent être déposés à l’adresse
https://www.easychair.org/conferences/?conf=semdis2013
COMITE D’ORGANISATION
Cécile Fabre CLLE, Toulouse
Nabil Hathout CLLE, Toulouse
Philippe Muller IRIT, Toulouse
Tim Van de Cruys IRIT, Toulouse
COMITÉ DE PROGRAMME
Stergos Afantenos IRIT, Toulouse
Yves Bestgen UCL/CECL, Louvain-La-Neuve
Marie Candito ALPAGE, Paris
Eric de la Clergerie ALPAGE, Paris
Cécile Fabre CLLE, Toulouse
Olivier Ferret CEA-LIST, Fontenay-aux-Roses
Nabil Hathout CLLE, Toulouse
Philippe Muller IRIT, Toulouse
Adeline Nazarenko LIPN, Paris
Pascale Sébillot IRISA, Rennes
Ludovic Tanguy CLLE, Toulouse
Agnès Tutin LIDILEM, Grenoble
Tim Van de Cruys IRIT, Toulouse
Virginie Zampa LIDILEM, Grenoble
CONTACT
mail : Cécile Fabre <cecile.fabre[arobas]univ-tlse2.fr>
Web : http://www.taln2013.org/atelier-de-semantique-distributionnelle/
-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version :
Archives : http://listserv.linguistlist.org/archives/ln.html
http://liste.cines.fr/info/ln
La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion : http://www.atala.org/
-------------------------------------------------------------------------
More information about the Ln
mailing list