Appel: Journée d'Etude de l'ATALA
alexis.nasr at LINGUIST.JUSSIEU.FR
alexis.nasr at LINGUIST.JUSSIEU.FR
Mon Apr 26 15:07:47 UTC 2004
Journée d'Etude de l'ATALA
==========================
Le traitement automatique des nouvelles formes de communication écrite
(e-mails, forums, chats, SMS, etc.)
Organisateurs
-------------
Emilie Guimier De Neef (France Telecom R & D)
Jean Véronis (Université de Provence)
Conférencier invité
-------------------
Jacques Anis, Université Paris X
Date
----
5 juin 2004
Lieu
----
ENST, 46, rue Barrault ou 49, rue Vergnault, 75013 Paris
Métro : Corvisart
Thème
-----
Depuis quelques années on assiste à une véritable explosion de
nouvelles formes de communication écrite (NFCE) : e-mails, forums,
chats, SMS, etc. Le développement de passerelles entre les différents
médias (les e-mails et les SMS s'écoutent) ainsi que la nécessité de
faciliter la gestion des contenus (classification automatique des
e-mails, recherche d'informations...) amènent de plus en plus de
technologies du TAL à s'appliquer aux NFCE : synthèse de la parole,
filtrage et classification automatique, détection automatique de
mots-clés et de thèmes, traduction automatique, etc. Or, les NFCE
montrent une grande déviance par rapport à l'écrit plus ou moins normé
que le TAL a l'habitude de traiter. Si on laisse de côté les problèmes
de composition posés par les e-mails (renvois successifs, complétion
progressive des messages) pour ne conserver que les aspects proprement
linguistiques posés par les NFCE, on observe d'une part des phénomènes
que l'on pourrait regrouper sous le terme de "ratés" (erreurs
orthographiques et typographiques, absence de séparateur entre les
mots etc.) qui doivent leur origine au mode de communication souvent
direct ou semi-direct, à la rapidité de composition du message ou aux
contraintes de saisies imposées par le clavier utilisé (terminal
mobile)... Mais on constate d'autre part une véritable émergence de
nouveaux modes d'écriture (abréviations, smileys, écriture "texto",
etc.), au milieu d'une très grande variabilité et d'une créativité
constante. Ce qui semble caractéristique des NFCE, c'est que les
utilisateurs inventent en permanence de nouveaux procédés. Enfin, des
caractéristiques fortement dialogiques rendent les NFCE intermédiaires
d'une certaine façon entre l'écrit "classique" et l'oral : les e-mails
se citent, les chats conversent.
Paradoxalement, on note peu de publications en TAL sur le sujet, qui a
surtout été abordé sous l'angle de la sociologie et de la
communication. Les difficultés qui se posent aux systèmes de TAL sont
immenses, même pour ceux qui ont atteint une certaine maturité sur
l'écrit classique (étiqueteurs morpho-syntaxiques, etc.). Elles
aboutissent le plus souvent à une dégradation considérable des
performances, rendant souvent leur utilisation presque impossible en
pratique.
Le but de la journée est de réunir des chercheurs autour des problèmes
liés au traitement linguistique des nouvelles formes de communication
écrite :
- ponctuation absente ou exagérément utilisée
- typographie déviante
- erreurs orthographiques massives
- mode de création des abréviations
- phonétisation de l'écriture
- nouvelles marques d'expressivité et d'émotion
- aspects dialogiques
- différences linguistiques profondes (usage des temps, etc.)
Cette liste n'est pas limitative.
Soumission
----------
Un résumé de deux à quatre pages doit être envoyé avant le 5 mai 2004
par courrier électronique, en format RTF ou TXT uniquement à
Emilie Guimier De Neef <emilie.guimierdeneef at rd.francetelecom.com>
ou
Jean Véronis <Jean.Veronis at up.univ-mrs.fr>
Les notifications d'acceptation seront envoyées le 15 mai 2004.
Pour plus d'informations sur l'ATALA et sur l'organisation des
journées d'études, consultez le site de l'ATALA à l'adresse :
http://www.atala.org
-------------------------------------------------------------------------
Message diffusé par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.biomath.jussieu.fr/LN/LN-F/
English version : http://www.biomath.jussieu.fr/LN/LN/
Archives : http://listserv.linguistlist.org/archives/ln.html
La liste LN est parrainée par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhésion : http://www.atala.org/
-------------------------------------------------------------------------
More information about the Ln
mailing list