Soutenance de th èse S. Weiser
Steph
steph.weiser at GMAIL.COM
Tue Jun 8 21:30:10 UTC 2010
Bonjour,
J'ai le plaisir de vous convier à la soutenance de ma thèse de doctorat
intitulée :
"Repérage et typage d'expressions temporelles pour l'annotation sémantique
automatique de pages Web - Application au e-tourisme"
Elle aura lieu mercredi 30 juin à 14h00 à l'Université Paris Ouest Nanterre
La Défense (salle Paul Ricoeur - B016).
Vous êtes aussi chaleureusement invités au pot qui suivra.
Bien cordialement,
Stéphanie Weiser
************
Résumé :
-------
Cette thèse présente Adetoa, système dédié au repérage et à l'annotation
sémantique automatique d'expressions temporelles dans des pages Web pour une
application de e-tourisme. Une étude linguistique détaillée a permis de
mettre en avant les caractéristiques et la complexité de l'expression de la
temporalité dans les pages Web touristiques. Une étude sémiotique de ce type
de pages a montré que les données y étaient organisées de manière fort
variée, ne présentant aucune régularité, ce qui rend difficile voire parfois
impossible l'automatisation de leur analyse.
Ces analyses ont mené à l'élaboration d'un ensemble important de
transducteurs (avec Unitex) pour les tâches de repérage et d'annotation des
expressions temporelles, ce qui constitue une ressource pouvant être
généralisée. De plus, d'autres informations du domaine touristique sont
repérées : les objets du tourisme et les adresses. Des transducteurs de
liage permettent de grouper toutes les informations concernant une même
offre touristique.
Pour l'annotation et l'intégration d'Adetoa à la chaîne de traitement du
projet Eiffel, un schéma d'annotation et des règles de transformations ont
été mis au point. Sans en être un calque direct, le schéma d'annotation suit
une ontologie du tourisme. Il permet ainsi de rester au plus près des
expressions linguistiques de manière à les caractériser finement.
L'ontologie a ensuite pu être adaptée en conséquence, pour un meilleur
stockage des données dans la base de connaissance qui lui correspond.
L'évaluation d'Adetoa, présentée dans cette thèse, a montré des résultats
satisfaisants aussi bien d'un point de vue théorique que pour cette
application industrielle.
Mots-clés : Extraction d'information automatique, ontologie, schéma
d'annotation, expressions temporelles, e tourisme, transducteurs.
Composition du jury :
-------------------
Florence Amardeilh - Maître de Conférences associé, Université Paris Ouest
Nanterre la Défense.
Delphine Battistelli - Maître de Conférences (HDR), Université Paris
IV-Sorbonne.
Cédrick Fairon - Professeur des Universités, Université Catholique de
Louvain-la-Neuve, rapporteur.
Éric Laporte - Professeur des Universités, Université Paris-Est
Marne-la-Vallée, rapporteur.
Philippe Laublet - Maître de Conférences, Université Paris IV-Sorbonne,
co-directeur.
Jean-Luc Minel - Professeur des Universités, Université Paris Ouest Nanterre
la Défense, directeur.
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://listserv.linguistlist.org/pipermail/parislinguists/attachments/20100608/484d865a/attachment.htm>
More information about the Parislinguists
mailing list