Sujet de these: Etude de l'equivalence linguistique en discours, LDI

Thierry Hamon thierry.hamon at UNIV-PARIS13.FR
Wed Jul 18 10:27:39 UTC 2012


Date: Tue, 17 Jul 2012 19:06:13 +0200
From: ecartier at ldi.univ-paris13.fr
Message-ID: <20120717190613.42524s3j5zbbzkw0 at webmail-ldi.univ-paris13.fr>


Projet de thèse financée en linguistique informatique

Sujet : étude linguistique de l'équivalence linguistique en discours

Résumé du projet :
La thèse se situe dans le domaine de la linguistique informatique.  Elle
aura une facette théorique et applicative de par une collaboration avec
une entreprise intéressée par ce type d'information et ses implications
dans le domaine du TAL.

La thèse traitera des relations d'équivalence dans les textes. Ce type
d'expression est très fréquent et permet de capter des relations
sémantiques de synonymie, d'antonymie, d'hyper- et d'hyponymie, qui
permettent de construire et de mettre à jour des dictionnaires «
sémantiques ». Les moyens linguistiques en sont variés, par exemple :
apposition (Robert Badinter, garde des sceaux...), conjonctions de
reformulation (l'éclatement de la bulle internet, c'est-à-dire la fin du
financement incontrôlé des entreprises travaillant dans le secteur des
nouveaux moyens de communication), verbes notamment définitoires (le
travail est défini selon le BIT comme ?).  Le projet de thèse vise à
étudier et clarifier les expressions linguistiques de l'équivalence en
français et en anglais. L'équivalence linguistique est le ressort
linguistique permettant de reformuler un même contenu, et très souvent
de compléter ce contenu. La thèse devra permettre de situer
linguistiquement l'équivalence vis-à-vis de notions proches comme la
reformulation, la paraphrase et la définition. La thèse devra également
permettre de répertorier les différents moyens d'expression de
l'équivalence en français et en anglais et d'en décrire les spécificités
linguistiques, notamment dans l'objectif de proposer une reconnaissance
automatique des ces expressions dans les textes.  La thèse aura un
versant applicatif dans le cadre d'un contrat du laboratoire avec une
entreprise, qui fournira différents corpus et différents logiciels
permettant le repérage.

L'objectif de la thèse est de :

- établir une typologie des différents types d'équivalence d'un point de
  vue linguistique, en distinguant ce type d?information notamment de la
  paraphrase et de la définition ;

- répertorier l'ensemble des moyens d'expression en français et en
  anglais de l'équivalence linguistique, d'en proposer un modèle
  opératoire du point de vue du TAL

- décrire formellement les expressions linguistiques afin de les
  reconnaître automatiquement dans des textes.

Profil du (de la) candidat(e):

Le ou la candidat(e) devra avoir une formation de haut niveau en
linguistique ainsi qu'en linguistique informatique. Master en
linguistique informatique de préférence, ou Master en linguistique avec
une formation complémentaire en Traitement Automatique des Langues.

Financement :

La thèse sera financée par le LDI dans le cadre d'un projet avec une
entreprise.

Laboratoire : le LDI (Lexiques, Dictionnaires, Informatique, UMR 7187)
est une UMR du CNRS dont les travaux portent sur la description
linguistique fine des unités de langue, à des fins d'exploitation
informatique. Le thésard sera en contact avec des linguistes ainsi que
des linguistes informaticiens. La thèse s'inscrivant dans le programme
global de l'équipe linguistique informatique, le thésard viendra
renforcer cette équipe.

Lieu : Université Paris 13 / PRES Paris Sorbonne Cité (Villetaneuse)

Encadrant : Salah Mejri (directeur), Emmanuel Cartier (responsable
scientifique et co-directeur)

Clôture des candidatures : 15 septembre 2012
Début de la thèse : septembre 2012 et au plus tard 1er janvier 2013

Merci d'envoyer un CV, une lettre de motivation et de une à trois
lettres de recommandation à Salah MEJRI (smejri at ldi.univ-paris13.fr ) et
Emmanuel CARTIER (ecartier at ldi.univ-paris13.fr)

-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/
-------------------------------------------------------------------------



More information about the Ln mailing list