ATALA: journee du 14/12/2002 : Le resume de texte automatique
Alexis Nasr
alexis.nasr at LINGUIST.JUSSIEU.FR
Mon Oct 28 17:02:22 UTC 2002
JOURNEES de l'ATALA - APPEL A COMMUNICATION
-------------------------------------------
Samedi 14 Decembre 2002
Le resume de texte automatique : solutions et perspectives
Organisee par J.P. Descles, A. Lehmam, J.L. Minel
Depuis juin 1997, date de la derniere journee ATALA consacree au
resume automatique, ce domaine de recherche s'est profondement
transforme; il fait aujourd'hui l'objet d'un interet particulier,
exprime a travers de nombreux colloques internationaux. Entre les
annees 2000 et 2002, il y a eu plus de colloques sur ce sujet qu'entre
l'annee 1958, debut des recherches sur le resume dans les laboratoires
d'IBM, et l'an 2000. Le dernier colloque sur le sujet s'est tenu a
Philadelphie dans le cadre de l'ACL 2002, en juillet dernier :
(http://www-nlpir.nist.gov/projects/duc/duc2002/Acl02SummarizationWorkshop.html
). Paradoxalement, les travaux en resume automatique sont trop peu
entrepris en France, en partie parce qu'ils exigent des competences a
la fois linguistiques et informatiques. Ainsi, tres peu de sujets de
theses dans ce domaine ont vu le jour et c'est seulement a partir de
1995 que nous avons pu assister a l'aboutissement de quelques
recherches : theses de A. Lehmam (Universite Nancy2, 1995) J. Berri
(Universite Paris4, 1996), N. Masson (Universite Paris 11), M.R. Amini
(Universite Paris6 2001).
Dans le domaine industriel des logiciels de resume automatique qui
mettent en oeuvre des methodes issues des laboratoires de recherche,
Copernic Summarizer (http://www.copernic.com/products/summarizer/),
Sinope Summarizer (http://www.sinope.nl/en/sinope/index.html),
Pertinence Summarizer (http://www.pertinence.net/).
sont commercialises et utilises par des entreprises.
Sur le plan scientifique, la problematique du resume automatique s'est
elargie dans diverses directions, par la prise en compte notamment des
relations rhetoriques, des cadres de discours, des niveaux de
discours, directs ou indirects, etc. En fait, ce domaine de recherche
a ete amene a depasser le traitement de la phrase comme unite
d'analyse, ce qui implique la recherche de concepts et de methodes
aptes a reperer et a representer des structures textuelles.
Si les textes scientifiques constituaient jusqu'au milieu des annees
1990, le champ d'experimentation des methodes de resume automatique,
la numerisation des textes et leur disponibilite sur la Toile a
profondement, elle aussi, modifie les besoins et les usages. En effet,
cette abondance de textes necessite la creation et la production
d'outils de resume performants en vue de trouver, de selectionner et
d'extraire l'information textuelle pertinente sous une forme
condensee. En ce qui concerne les besoins, il est apparu necessaire
de coupler des outils de recherche d'information sur la Toile avec des
outils de resume automatique (Chaudiron & Flurh 2001). Quant aux
usages, le developpement d'outils de navigation textuelle necessite
une reflexion sur les effets de la representation des textes et sur la
conception des interfaces de lecture, rejoignant ainsi les etudes
menees dans le domaine des sciences de l'information sur les nouvelles
formes de mediatisation des formes ecrites.
L'objet de cette journee est donc double:
D'une part, encourager les presentations de nouvelles approches ou
methodes pouvant aboutir a des realisations concretes traduites dans
des prototypes prometteurs. Il s'agit aussi de faire prendre
conscience de l'importance du resume automatique en tant que
technologie d'ingenierie linguistique. Quelle que soit l'approche
entreprise en matiere de resume automatique il n'existe cependant que
deux techniques de realisation distinctes; d'abord celle qui procede
par extraction de phrases entieres du texte source et ensuite celle
qui produit un nouveau texte condense a la suite d'un travail de
generation. Seule la premiere technique a permis la realisation de
logiciels pouvant etre consideres comme donnant des resultats
suffisamment acceptables, apres evaluation, en vue de pretendre a une
commercialisation. La seconde reste uniquement au stade de la
recherche vu les nombreux problemes linguistiques qui resteraient a
resoudre au niveau de l'interpretation tout en tenant compte des
contraintes liees a la realisation informatique.
D'autre part, proposer des passerelles entre les differentes
disciplines pour lesquelles le texte constitue un des principaux
objets d'etudes (comme par exemple les travaux sur les usages des
medias numerises).
Les propositions de communication pourront en particulier apporter une
contribution aux themes suivants :
- Nouvelles methodes et strategies
- Approches numeriques vs approches linguistiques
- Apport de la terminologie et des ontologies aux systemes de resume
- Identification des themes
- Argumentation et resume automatique
- Filtrage semantique de textes
- Generation de resume
- Ressources linguistiques necessaires aux systemes de resume
- Resume automatique multilingue
- Resume utilise pour la traduction automatique
- Prototypes et logiciels
- Integration des systemes de resume dans les reseaux (Internet,
Intranet, Extranet')
- Modes d'evaluation et de comparaison des systemes de resume
- Interfaces de visualisation et de navigation dediees aux systemes de
resume
- Integration de systemes de resume dans des plate-formes de
traitements linguistiques
- Identification economique des besoins
Nous demandons aux auteurs de preciser si leur soumission :
1) concerne des travaux en cours, ou des prises de position (envoyer
une page);
2) des travaux aboutis du point de vue theorique ou applique (envoyer
3 pages)..
Les textes seront preferentiellement en Word ou en pdf.
Les propositions de demonstration de logiciels, prototypes ou outils
industriels, sont aussi fortement souhaitees.
Bibliographie
Amini, M.R. (2001). Apprentissage automatique et recherche de
l'information: application a l'extraction d'information de surface et
au resume de texte These de doctorat, Universite Paris6, Paris.
Berri, J. (1996). Contribution a la methode d'exploration
contextuelle. Applications au resume automatique et aux
representations temporelles. Realisation informatique du systeme
SERAPHIN. These de doctorat, Universite Paris-Sorbonne, Paris.
Chaudiron S., C. FLUHR. (2001). Filtrage et resume automatique de
l'information sur les reseaux, 3° congres du Chapitre français de
l'ISKO.
Lehmam, A. (1995). Le resume automatique des textes scientifiques et
techniques ; aspects linguistiques et computationnels : realisation du
systeme RAFI- (Resume Automatique par Fragments Indicateurs), These de
doctorat, Universite de Nancy 2.
Masson, N. (1998). Methodes pour une generation variable de resume
Automatique : Vers un systeme de reduction de textes, These de
Doctorat, Universite Paris-11.
Minel J.-L., J.-P. Descles. (2000) Resume Automatique et Filtrage des
textes, in Ingenierie des langues, (sous la direction de J-M. Pierrel)
Paris, Editions Hermes, p. 253-270.
RIFRA'98, Rencontre Internationale sur l'Extraction le Filtrage et le
Resume Automatiques, Sfax, Tunisie..
Soumission (modalites)
Un resume de deux a quatre pages doit etre envoye avant le 15 novembre
2002 par courrier electronique en format .rtf, .doc ou .pdf a :
Abderrafih Lehmam : lehmam at pertinence.net
et
Jean Luc Minel : Jean-Luc.Minel at paris4.sorbonne.fr
Les notifications d'acceptation seront donnees pour le 20 Novembre
2002.
************************************************
Jean-Luc MINEL
equipe LaLICC CNRS - Universite Paris-Sorbonne
ISHA, 96 Boulevard Raspail
75 006 Paris
Telephone : (33) 1 44 39 89 56
Telecopie : (33) 1 44 39 89 51
Couriel : minel at msh-paris.fr
Jean-Luc.Minel at paris4.sorbonne.fr
http://www.lalic.paris4.sorbonne.fr/~minel
http://www.lalic.paris4.sorbonne.fr
*************************************************
-------------------------------------------------------------------------
Message diffusé par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.biomath.jussieu.fr/LN/LN-F/
English version : http://www.biomath.jussieu.fr/LN/LN/
Archives : http://listserv.linguistlist.org/archives/ln.html
La liste LN est parrainée par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhésion : http://www.atala.org/
-------------------------------------------------------------------------
More information about the Ln
mailing list