[Corpora-List] PhD in Computational Linguistics at the University of Paris 13 Sorbonne Cit=?iso-8859-1?Q?=E9=2C_?=France
CARTIER Emmanuel
ecartier at ldi.univ-paris13.fr
Tue Jul 17 16:59:05 UTC 2012
Dear all,
Applications are invited for one PhD on the topic of linguistic
expression of equality / equivalence in French and English discourse.
The student will be paid for three years through a project grant with
a Document Engineering private company. It will be based at the
University of Paris 13 Sorbonne Cité.
The closing date for applications is September 15, 2012. The PhD is
open to students who hold a Master's degree.
Required qualifications:
- Master's degree in computational linguistics, linguistics or a
related discipline,
- Good programming skills,
- Good oral and written communication skills in French and English.
For details and further information, see French details below and/or
send an email to Emmanuel Cartier (ecartier at ldi.univ-paris13.fr)
******************************* French version / version française
Projet de thèse financée en linguistique informatique
Sujet : étude linguistique de l'équivalence linguistique en discours
Résumé du projet :
La thèse se situe dans le domaine de la linguistique informatique.
Elle aura une facette théorique et applicative de par une
collaboration avec une entreprise intéressée par ce type d'information
et ses implications dans le domaine du TAL.
La thèse traitera des relations d'équivalence dans les textes. Ce type
d'expression est très fréquent et permet de capter des relations
sémantiques de synonymie, d'antonymie, d'hyper- et d'hyponymie, qui
permettent de construire et de mettre à jour des dictionnaires «
sémantiques ». Les moyens linguistiques en sont variés, par exemple :
apposition (Robert Badinter, garde des sceaux...), conjonctions de
reformulation (l'éclatement de la bulle internet, c'est-à-dire la fin
du financement incontrôlé des entreprises travaillant dans le secteur
des nouveaux moyens de communication), verbes notamment définitoires
(le travail est défini selon le BIT comme ?).
Le projet de thèse vise à étudier et clarifier les expressions
linguistiques de l'équivalence en français et en anglais.
L'équivalence linguistique est le ressort linguistique permettant de
reformuler un même contenu, et très souvent de compléter ce contenu.
La thèse devra permettre de situer linguistiquement l'équivalence
vis-à-vis de notions proches comme la reformulation, la paraphrase et
la définition. La thèse devra également permettre de répertorier les
différents moyens d'expression de l'équivalence en français et en
anglais et d'en décrire les spécificités linguistiques, notamment dans
l'objectif de proposer une reconnaissance automatique des ces
expressions dans les textes.
La thèse aura un versant applicatif dans le cadre d'un contrat du
laboratoire avec une entreprise, qui fournira différents corpus et
différents logiciels permettant le repérage.
L'objectif de la thèse est de :
- établir une typologie des différents types d'équivalence d'un point
de vue linguistique, en distinguant ce type d?information notamment de
la paraphrase et de la définition ;
- répertorier l'ensemble des moyens d'expression en français et en
anglais de l'équivalence linguistique, d'en proposer un modèle
opératoire du point de vue du TAL
- décrire formellement les expressions linguistiques afin de les
reconnaître automatiquement dans des textes.
Profil du (de la) candidat(e):
Le ou la candidat(e) devra avoir une formation de haut niveau en
linguistique ainsi qu'en linguistique informatique. Master en
linguistique informatique de préférence, ou Master en linguistique
avec une formation complémentaire en Traitement Automatique des Langues.
Financement :
La thèse sera financée par le LDI dans le cadre d'un projet avec une
entreprise.
Laboratoire : le LDI (Lexiques, Dictionnaires, Informatique, UMR
7187) est une UMR du CNRS dont les travaux portent sur la description
linguistique fine des unités de langue, à des fins d'exploitation
informatique. Le thésard sera en contact avec des linguistes ainsi que
des linguistes informaticiens. La thèse s'inscrivant dans le programme
global de l'équipe linguistique informatique, le thésard viendra
renforcer cette équipe.
Lieu : Université Paris 13 / PRES Paris Sorbonne Cité (Villetaneuse)
Encadrant : Salah Mejri (directeur), Emmanuel Cartier (responsable
scientifique et co-directeur)
Clôture des candidatures : 15 septembre 2012
Début de la thèse : septembre 2012 et au plus tard 1er janvier 2013
Merci d'envoyer un CV, une lettre de motivation et de une à trois
lettres de recommandation à Salah MEJRI (smejri at ldi.univ-paris13.fr )
et Emmanuel CARTIER (ecartier at ldi.univ-paris13.fr)
Emmanuel Cartier
Enseignant-Chercheur en Linguistique Informatique
LDI CNRS UMR 7187
Universite Paris 13
99 avenue Jean-Baptiste Clement
93430 Villetaneuse
tel : (+33) 01 49 40 38 58
fax : (+33) 01 49 40 40 99
email : ecartier at ldi.univ-paris13.fr
www-ldi.univ-paris13.fr
----------------------------------------------------------------
This message was sent using IMP, the Internet Messaging Program.
_______________________________________________
UNSUBSCRIBE from this page: http://mailman.uib.no/options/corpora
Corpora mailing list
Corpora at uib.no
http://mailman.uib.no/listinfo/corpora
More information about the Corpora
mailing list