These: Pierre Hankach, Generation automatique de textes par satisfaction de contraintes

Thierry Hamon thierry.hamon at UNIV-PARIS13.FR
Sat May 30 08:31:56 UTC 2009


Date: Thu, 28 May 2009 11:27:04 +0200
From: Pierre Hankach <pierre.hankach at gmail.com>
Message-ID: <cb20e0ac0905280227l2af3125esc5aac0a71ea336b6 at mail.gmail.com>

bonjour,

vous êtes cordialement invité à la soutenance de ma thèse intitulé
"génération automatique de textes par satisfaction de contraintes"
(résumé ci-joint), et au pot qui va suivre.

La soutenance aura lieu le 3 Juin à 11 h à:
Université Paris Diderot - Paris 7
Bâtiment Lamarck
35, rue Hélène Brion (RdC haut)
5, rue Marie-Andrée Lagroua Weill-Hallé (RdC Bas)
75013 PARIS
 Salles
Visioréunion : RB 15 (RdC Bas - salle 15)

Le jury sera constitué de:
Prof. Nicholas ASHER (Rapporteur)
Prof. Philippe BLACHE (Rapporteur)
M. Conf. Maxime Amblard (Examinateur)
Prof. Laurence DANLOS (Directrice de thèse)
Chercheur Franck PANAGET (Co-directeur de thèse)

Très cordialement,
Pierre Hankach

Nous nous intéressons dans cette thèse à la construction d'un système
de génération automatique – un logiciel informatique capable de
transformer une représentation formelle de l’information en un texte
en langage naturel. Dans notre approche, nous définissons la
génération comme un problème de satisfaction de contraintes (CSP). Le
système résultant garantit un traitement intégré des opérations de la
génération car les différentes dépendances sont prises en compte et
aucune priorité n’est donnée à un type d’opération par rapport aux
autres.

Pour définir le problème de satisfaction de contraintes, nous
représentons les opérations de construction du texte par des variables
de décision. Les opérations individuelles qui  réalisent un même type
d’expressions minimales dans le texte sont groupées ensemble et
constituent une tâche de la génération. Nous classons les variables de
décision  selon les types d'opérations qu'elles représentent
(e.g. variables de sélection du contenu, variables de structuration du
document…). Les règles linguistiques régissant les opérations sont
représentées par des contraintes sur les variables. Une contrainte
peut être définie sur des variables d’un ou plusieurs type(s),
marquant la dépendance entre les opérations correspondantes. 

La production d’un texte consiste en la résolution du système global
des contraintes, c’est-à-dire trouver une affectation complète des
variables qui ne viole pas les contraintes.

Dans le cadre de la définition de la grammaire de contraintes, nous
formulons notamment la partie qui régit les opérations de
structuration du document. Nous modélisons par des contraintes la
structure rhétorique développée par la SDRT afin d'aboutir à des
textes cohérents à la sortie du générateur. Auparavant, afin
d'augmenter les capacités de génération de notre système, nous
étendons cette structure rhétorique pour couvrir les textes non
canoniques. En plus de la définition de ces contraintes pour la
cohérence, nous formulons un ensemble de contraintes qui permettent de
façonner la macrostructure en fonction des buts communicatifs afin de
favoriser leur réalisation.

Enfin, nous proposons une solution au problème de la complexité de
calcul de la génération de textes de grande taille. Cette solution
repose sur la génération de ces textes par paquet de propositions. Le
problème de génération du texte global est ainsi défini comme
plusieurs problèmes de génération de parties du texte. Ces parties
sont de taille limitée et la complexité associée à leur génération
reste raisonnable. Le partitionnement proposé est motivé par des
considérations linguistiques.

-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/
-------------------------------------------------------------------------



More information about the Ln mailing list