[Corpora-List] PhD in Computational Linguistics at the University of Paris 13 Sorbonne Cit=?iso-8859-1?Q?=E9=2C_?=France

CARTIER Emmanuel ecartier at ldi.univ-paris13.fr
Tue Jul 17 16:59:05 UTC 2012


Dear all,

Applications are invited for one PhD on the topic of linguistic  
expression of equality / equivalence in French and English discourse.  
The student will be paid for three years through a project grant with  
a Document Engineering private company. It will be based at the  
University of Paris 13 Sorbonne Cité.

The closing date for applications is September 15, 2012. The PhD is  
open to students who hold a Master's degree.

Required qualifications:
- Master's degree in computational linguistics, linguistics or a  
related discipline,
- Good programming skills,
- Good oral and written communication skills in French and English.

For details and further information, see French details below and/or  
send an email to Emmanuel Cartier (ecartier at ldi.univ-paris13.fr)


******************************* French version / version française

Projet de thèse financée en linguistique informatique

Sujet : étude linguistique de l'équivalence linguistique en discours

Résumé du projet :
La thèse se situe dans le domaine de la linguistique informatique.  
Elle aura une facette théorique et applicative de par une  
collaboration avec une entreprise intéressée par ce type d'information  
et ses implications dans le domaine du TAL.

La thèse traitera des relations d'équivalence dans les textes. Ce type  
d'expression est très fréquent et permet de capter des relations  
sémantiques de synonymie, d'antonymie, d'hyper- et d'hyponymie, qui  
permettent de construire et de mettre à jour des dictionnaires «  
sémantiques ». Les moyens linguistiques en sont variés, par exemple :  
apposition (Robert Badinter, garde des sceaux...), conjonctions de  
reformulation (l'éclatement de la bulle internet, c'est-à-dire la fin  
du financement incontrôlé des entreprises travaillant dans le secteur  
des nouveaux moyens de communication), verbes notamment définitoires  
(le travail est défini selon le BIT comme ?).
Le projet de thèse vise à étudier et clarifier les expressions  
linguistiques de l'équivalence en français et en anglais.  
L'équivalence linguistique est le ressort linguistique permettant de  
reformuler un même contenu, et très souvent de compléter ce contenu.  
La thèse devra permettre de situer linguistiquement l'équivalence  
vis-à-vis de notions proches comme la reformulation, la paraphrase et  
la définition. La thèse devra également permettre de répertorier les  
différents moyens d'expression de l'équivalence en français et en  
anglais et d'en décrire les spécificités linguistiques, notamment dans  
l'objectif de proposer une reconnaissance automatique des ces  
expressions dans les textes.
La thèse aura un versant applicatif dans le cadre d'un contrat du  
laboratoire avec une entreprise, qui fournira différents corpus et  
différents logiciels permettant le repérage.

L'objectif de la thèse est de :
- établir une typologie des différents types d'équivalence d'un point  
de vue linguistique, en distinguant ce type d?information notamment de  
la paraphrase et de la définition ;
- répertorier l'ensemble des moyens d'expression en français et en  
anglais de l'équivalence linguistique, d'en proposer un modèle  
opératoire du point de vue du TAL
- décrire formellement les expressions linguistiques afin de les  
reconnaître automatiquement dans des textes.

Profil du (de la) candidat(e):
Le ou la candidat(e) devra avoir une formation de haut niveau en  
linguistique ainsi qu'en linguistique informatique. Master en  
linguistique informatique de préférence, ou Master en linguistique  
avec une formation complémentaire en Traitement Automatique des Langues.

Financement :
La thèse sera financée par le LDI dans le cadre d'un projet avec une  
entreprise.

Laboratoire :  le LDI (Lexiques, Dictionnaires, Informatique, UMR  
7187)  est une UMR du CNRS dont les travaux portent sur la description  
linguistique fine des unités de langue, à des fins d'exploitation  
informatique. Le thésard sera en contact avec des linguistes ainsi que  
des linguistes informaticiens. La thèse s'inscrivant dans le programme  
global de l'équipe linguistique informatique, le thésard viendra  
renforcer cette équipe.

Lieu : Université Paris 13 / PRES Paris Sorbonne Cité (Villetaneuse)

Encadrant : Salah Mejri (directeur), Emmanuel Cartier (responsable  
scientifique et co-directeur)

Clôture des candidatures : 15 septembre 2012
Début de la thèse : septembre 2012 et au plus tard 1er janvier 2013

Merci d'envoyer un CV, une lettre de motivation et de une à trois  
lettres de recommandation à Salah MEJRI (smejri at ldi.univ-paris13.fr )  
et Emmanuel CARTIER (ecartier at ldi.univ-paris13.fr)



Emmanuel Cartier
Enseignant-Chercheur en Linguistique Informatique
LDI CNRS UMR 7187
Universite Paris 13
99 avenue Jean-Baptiste Clement
93430 Villetaneuse
tel : (+33) 01 49 40 38 58
fax : (+33) 01 49 40 40 99
email : ecartier at ldi.univ-paris13.fr
www-ldi.univ-paris13.fr

----------------------------------------------------------------
This message was sent using IMP, the Internet Messaging Program.


_______________________________________________
UNSUBSCRIBE from this page: http://mailman.uib.no/options/corpora
Corpora mailing list
Corpora at uib.no
http://mailman.uib.no/listinfo/corpora



More information about the Corpora mailing list