Sujet de these: analyse syntaxique probabiliste, Alpage

Thierry Hamon thierry.hamon at UNIV-PARIS13.FR
Fri May 15 14:49:44 UTC 2009


Date: Fri, 15 May 2009 10:07:01 +0200
From: Marie Candito <marie.candito at gmail.com>
Message-ID: <4A0D22A5.8010707 at gmail.com>

[english version below]

** Offre de thèse dans le domaine de l'analyse syntaxique probabiliste
   **

Laboratoire : Alpage (Analyse Linguistique Profonde à Grande Echelle),
équipe-projet INRIA / Université Paris 7

Lieu :  Paris 13ème
Date : 1/9/2009
Durée : 3 ans

Cette thèse s'inscrit dans le projet ANR Sequoia qui porte sur
l'analyse syntaxique probabiliste à large couverture du français.

La thèse concernera la place du lexique dans l'analyse syntaxique
probabiliste, avec la définition / l'amélioration de modèles
statistiques de façon à permettre l'intégration de ressources
lexicales externes, telles que des lexiques statiques ou des
dépendances bilexicales acquises sur corpus.

L'utilisation de telles ressources externes est en effet cruciale pour:

- une meilleure couverture lexicale, non réduite au vocabulaire du
  corpus d'apprentissage

- la capture de contraintes syntaxiques et sémantiques moins locales

- une moindre dispersion des données d'apprentissage, en permettant
  l'usage de corpus externes

Profil recherché :
- formation en TAL ou en apprentissage automatique
- maîtrise des langages Java et/ou C et C++

Contacts:

Alexis Nasr
alexis.nasr at lif.univ-mrs.fr
Marie Candito
marie.candito at linguist.jussieu.fr


------------------------------------------------------------------------------ 


** 3 year PhD funding in the field of statistical parsing for French **

Research Group : Alpage (Analyse Linguistique A Grande Echelle) -
INRIA / Université Paris 7
Location : Paris, France
Starting : 1/9/2009

This PhD is part of a French National Research Agency funded project
on large scale probabilistic parsing of French.

The PhD will investigate the role of the lexicon in statistical
parsing, with the definition of an improved statistical parsing model,
that can integrate external lexical resources : static lexicons or
lexical dependencies gathered from parsed corpora.

External lexical resources are crucial for :
- better lexical coverage, that should not be restricted to the
  treebank vocabulary
- reduced data sparseness, with counts taken from potentially huge
  corpora
- better handling of non-local constraints
- domain adaptation, via lexicon adaptation

The successful candidate should :

- hold a relevant degree in the field of Natural Language Processing
  or Machine Learning.

- master either Java or C and C++ programming languages

Contacts:

Alexis Nasr
alexis.nasr at lif.univ-mrs.fr
Marie Candito
marie.candito at linguist.jussieu.fr

-- 
Marie Candito
Maître de Conférences 
UFR de Linguistique - Université Paris 7
Equipe Alpage (INRIA / Université Paris 7)
Tel: +33 1 57 27 57 74
Fax: +33 1 57 27 57 81

-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/
-------------------------------------------------------------------------



More information about the Ln mailing list