Appel: Journee ATALA, Le web comme ressource pour le TAL, 11 mars 2006
Thierry Hamon
thierry.hamon at LIPN.UNIV-PARIS13.FR
Fri Oct 14 12:25:57 UTC 2005
Date: Fri, 14 Oct 2005 14:06:58 +0200
From: Nuria Gala <nuria.gala at up.univ-aix.fr>
Message-ID: <434F9F62.6030906 at up.univ-aix.fr>
X-url: http://www.atala.org/rubrique.php3?id_rubrique=2
Journée ATALA
Le Web comme ressource pour le TAL
Appel à communications et à démonstrations
*Date de la Journée* : 11 mars 2006*
Date Limite de Soumission :* 20 janvier 2006
*Organisation *: Nuria Gala (DELIC), Gregory Grefenstette (CEA)
*Lieu* : ENST 46 r Barrault, 75634 Paris Cedex 13
Objectifs
L'utilisation du World Wide Web comme grande base d'exemples, pour
différentes tâches liées au traitement automatique du langage, est une
idée exploitée depuis peu. On peut citer les travaux de [Grefenstette
99] pour la traduction de noms composés, ceux de [Jacquemin et Bush 00]
pour l'acquisition d'entités nommées, ceux de [Banko, Brill, Dumais et
Lin 02] pour la réponse aux questions, ou encore ceux de [Volk 01] ou
[Gala 03] pour la désambiguïsation du rattachement prépositionnel. Tous
ces travaux, ainsi que d'autres plus récents, démontrent l'utilité du
Web pour différentes tâches linguistiques, montrant une amélioration des
résultats bien au-delà de ceux obtenus avec des ressources plus petites.
Ceci, en dépit des critiques sur la qualité des données du Web.
Cette journée ATALA donnera une vision générale des recherches
actuelles qui utilisent le Web comme ressource pour différentes
tâches liées au traitement automatique et se situera, aussi, dans la
lignée d'autres événements scientifiques faisant preuve de l'essor
de la thématique autour du Web comme ressource: /Workshop on Web as
a Corpus/, Corpus Linguistics 05 ; /Workshop on Deep Lexical
Acquisition/, ACL-SIGLEX 05 ; et des sessions sur l'analyse de texte
dans la 14e /International World Wide Web Conference/ WWW'2005.
Thèmes de la journée
La journée commencera avec un conférencier invité (Adam Kilgarriff)
qui donnera une perspective globale des travaux en cours ainsi que des
possibilités offertes par le Web. La journée se poursuivra par des
exposés et démos parmi les thèmes suivants :
- construction de corpus à partir du web
- outils, interfaces, etc. de « butinage du web » (/Web crawling/) à
des fins linguistiques
- création d'ontologies et de bases terminologiques à partir du web
- extraction de connaissances
- utilisation du web dans des systèmes question-réponse
- indexation et extraction d'information à partir de grandes
collections de données
- quantité et la qualité des données disponible sur le Web
- exploitation de données bruitées
Cette journée montrera aussi des applications utilisant ces données et
pourra traiter d'autres aspects du WWW comme ressource linguistique.
Organisation
- communications orales (environ 30mn de présentation, proposition sur
deux à quatre pages),
- démonstrations (une ou deux pages présentant les caractéristiques de
la ressource : architecture, couverture, type d'information, etc.)
Les propositions seront à envoyer à Nuria Gala
<mailto:nuria.gala at up.univ-aix.fr> (nuria.gala at up.univ-aix.fr
<mailto:nuria.gala at up.univ-aix.fr>) au plus tard le *20 janvier* (textes
en français pour les francophones, ouvert aux participants de tous les
pays -anglais autorisé). Les résumés seront publiés après la Journée sur
le site de l'ATALA
(http://www.atala.org/rubrique.php3?id_rubrique=2).
-------------------------------------------------------------------------
Message diffusé par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.biomath.jussieu.fr/LN/LN-F/
English version : http://www.biomath.jussieu.fr/LN/LN/
Archives : http://listserv.linguistlist.org/archives/ln.html
La liste LN est parrainée par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhésion : http://www.atala.org/
-------------------------------------------------------------------------
More information about the Ln
mailing list