These: Eric Y. Kow, Realisation de surface : ambiguite et determinisme

Thierry Hamon thierry.hamon at LIPN.UNIV-PARIS13.FR
Fri Nov 9 17:16:10 UTC 2007


Date: Tue, 6 Nov 2007 16:11:43 +0100
From: "Eric Y. Kow" <Eric.Kow at loria.fr>
Message-ID: <20071106151143.GA9199 at chartreuse.loria.fr>
X-url: http://www.loria.fr/~kow/kowthese-1.0.pdf.zip
X-url: http://www.loria.fr/access/acceder
X-url: http://www.loria.fr/~kow


Bonjour,
 
J'ai le plaisir de vous annoncer ma soutenance de thèse intitulée
« Réalisation de surface : ambiguïté et détérminisme ».

La soutenance aura lieu le mercredi 14 novembre à 9h à Nancy.
Vous y êtes cordialement invités, ainsi qu'au pot qui suivra
en fin d'après-midi.

Le jury est composé de :
 * John Carroll, Professeur, University of Sussex, Brighton, UK
 * Patrick Saint-Dizier, Directeur de recherche, CNRS, Toulouse

 * Eric de la Clergerie, Chargé de Recherche, INRIA Rocquencourt
 * Claire Gardent, Directrice de Recherche, CNRS, Nancy
 * Dominique Méry, Professeur, Université Henri Poincaré, Nancy

Cordialement,

Eric Kow

 =======================================================================

Réalisation de surface : ambiguïté et détérminisme 
Eric Kow
http://www.loria.fr/~kow/kowthese-1.0.pdf.zip

mercredi 14 novembre, à 9h
Nancy (LORIA, Amphi C)
http://www.loria.fr/access/acceder

------------------------------------------------------------------------
Résumé
------------------------------------------------------------------------

La réalisation de surface est une partie du processus global de
génération de langue naturelle. Elle peut être vue comme l'inverse de
l'analyse en ce sens où, étant donné une grammaire et une représentation
du sens, le réalisateur de surface produit une chaîne en langue
naturelle que la grammaire associe à un sens donné en entrée.. Cette
thèse présente trois extensions de GenI, un logiciel de réalisation
pour une grammaire de type FB-LTAG.

La première extension augmente l'efficacité du réalisateur pour le
traitement de l'ambiguïté lexicale. C'est une adaptation de
l'optimisation par « étiquetage électrostatique » qui existe déjà pour
l'analyse, qui consiste à associer les items lexicaux à des ensembles de
polarités, et à éliminer les combinaisons dont les polarités ne sont pas
neutres. 

La deuxième extension concerne le nombre de sorties retournées par le
réalisateur. En temps normal, l'algorithme utilisé par GenI retourne
toutes les phrases associées à une même forme logique. Alors qu'on peut
considérer que ces entrées ont le même sens, elles présentent souvent de
subtiles nuances.   Il est important que les systèmes de génération
contrôlent ces facteurs supplémentaires. Ici, nous montrons comment la
spécification de l'entrée peut être augmentée d'annotations qui
permettent un tel contrôle des sorties. L'extension est permise par le
fait que la grammaire FB-LTAG utilisée par le générateur a été
construite à partir d'une « métagrammaire », mettant explicitement en
œuvre les généralisations qu'elle code. 

La dernière extension donne la possibilité au réalisateur de servir
d'environnement de débuggage de la métagrammaire. Les erreurs dans la
métagrammaire peuvent avoir des conséquences importantes pour la
grammaire. Comme le réalisateur donne en sortie toutes les chaînes
associées à une sémantique d'entrée, il peut être utilisé pour trouver
ces erreurs et les localiser dans la métagrammaire.

------------------------------------------------------------------------
Abstract
------------------------------------------------------------------------

Surface realisation is a subtask of natural language generation.  It may
be viewed as the inverse of parsing, that is, given a grammar and a
representation of meaning, the surface realiser produces a natural
language string that is associated by the grammar to the input meaning.
This thesis presents three extensions to GenI, a surface realiser
for Feature-Based Tree Adjoining Grammar (FB-LTAG).

The first extension improves the efficiency of the realiser with respect
to lexical ambiguity.  It is an adaptation from parsing of the
"electrostatic tagging" optimisation, in which lexical items are
associated with a set of polarities, and combinations of those items
with non-neutral polarities are filtered out.

The second extension deals with the number of outputs returned by the
realiser.  Normally, the GenI algorithm returns all of the sentences
associated with the input logical form.  Whilst these inputs can be seen
as having the same core meaning, they often convey subtle distinctions
in emphasis or style.  It is important for generation systems to be able
to control these extra factors.  Here, we show how the input
specification can be augmented with annotations that provide for the
fine-grained control that is required.  The extension builds off the
fact that the FB-LTAG grammar used by the generator was constructed from
a "metagrammar", explicitly putting to use the linguistic
generalisations that are encoded within.

The final extension provides a means for the realiser to act as a
metagrammar-debugging environment.  Mistakes in the metagrammar can have
widespread consequences for the grammar.  Since the realiser can output
all strings associated with a semantic input, it can be used to find out
what these mistakes are, and crucially, their precise location in the
metagrammar.



-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/
-------------------------------------------------------------------------



More information about the Ln mailing list