Sujet de these: Generation, Ingenierie Logicielle et Grammaires Computationelles

Thierry Hamon thierry.hamon at UNIV-PARIS13.FR
Tue May 8 19:33:50 UTC 2012


Date: Mon, 7 May 2012 16:31:56 +0200
From: Claire Gardent <claire.gardent at loria.fr>
Message-ID: <CAKxJxswNim9iW3frJw6aDbv+-gyEDAJV0tUE8OSnbdTYJ1RttQ at mail.gmail.com>

Proposition de Contrat Doctoral
Spécialité : Informatique
Lieu : Université de Lorraine, Nancy, France
Début : Octobre 2012
Durée : 3 ans

Date Limite de Candidature: ** 01 juin 2012 **
Titre : Génération, Ingéniérie logicielle et Linguistique Informatique
Encadrante : Claire GARDENT
Unité de recherche : LORIA - Laboratoire Lorrain de Recherche en
Informatique et ses Applications UMR 7503

Profil souhaité: Master en Informatique avec spécialisation ou intérêt
pour le Traitement Automatique des Langues

Sites Web:
Encadrante: http://www.loria.fr/~gardent/
Sujet détaillé et procédure : http://www.iaem.uhp-nancy.fr/ (onglet
Propositions
Contrats Doctoraux, Sujet: Ingéniérie Logicielle pour la Linguistique
Informatique)

Candidature :
Envoyer un CV (avec le détail des cours et notes de Master), une lettre
de candidature, ainsi qu'une lettre de recommandation ou les coordonnées
d'au moins un référent universitaire à claire.gardent at loria.fr.

Résumé : Ce sujet de thèse porte sur l'interaction entre génération de
texte, génie logiciel et grammaire informatique. Il s'agit d'étudier
dans quelle mesure la génération permet de développer des méthodes et
des outils permettant (i) une analyse systématique des phrases produites
par les grammaires symboliques computationnelles développées pour la
langue naturelle; et (ii) un processus itératif d'analyse et de
modifications permettant d'aboutir à une grammaire “correcte” i.e., une
grammaire sans sur- ou sous-génération pour un fragment donné de la
langue. On cherchera en particulier, à dynamiser ce processus en
couplant le processus d'analyse avec un processus de visualisation
permettant au linguiste d'appréhender "en direct" l'impact de ses
modifications sur la couverture, la précision, la sur- et la
sousgénération de la grammaire modifiée.

Le travail de thèse s'appuiera d'une part sur les méthodes d'ingéniérie
logicielle mises au point pour le debugging des grammaires formelles
(Klint et al. 2005) et d'autre part, sur celles développées en
linguistique informatique pour améliorer les grammaires computationelles
pour les langues naturelles.

Il prendra également en compte les outils et méthodes développés au
cours des dernières années dans Talaris/Synalp pour analyser ces
grammaires notamment GenSem et GraDE (Gardent et al 2011; Gardent et
Kruszewski 2012), des outils qui permettent de traverser une grammaire
et d'énumérer les phrases produites par cette traversée ; et un
algorithme de fouille d'erreur permettant d'identifier les sources
probables d'erreur (Gardent et Narayan 2012).


Références bibliographiques

[1] C. Gardent and S. Narayan. Error Mining on Dependency Trees. ACL
    2012.
[2] C. Gardent and G. Kruszewski. Generation for Grammar
    Engineering. INLG 2012.
[3] C. Gardent, B. Gottesman and L. Perez-Beltrachini Using Regular Tree
    Grammar to enhance Surface Realisation . Natural Language
    Engineering, Volume 17, pp 185 - 201, Special Issue on Finite State
    Methods and Models in Natural Language Processing.
[4] D. de Kok, J. Ma and G. van Noord. A generalised method for
    iterative error mining in parsing results. In Workshop Grammar
    Engineering Across Frameworks, ACL 2009.
[5] P. Klint R. Lämmel and C. Verhoef. Toward an engineering discipline
    for grammarware. ACM Transactions on Software Engineering
    Methodology, 14(3):331–380, 2005.
[6] M.J. Nederhof. Efficient generation of random sentences. Natural
    Language Engineering, 2(1):1- 13, 1996.
[7] G. van Noord. Error Mining for Wide Coverage Grammar
    Engineering. ACL 2004.
[8] B. Sagot and E. de la Clergerie. Error Mining in Parsing
    Results. ACL 2006

Début de la thèse     1 octobre 2012
Date de dépôt du sujet    20 mars 2012

-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/
-------------------------------------------------------------------------



More information about the Ln mailing list