Stage: Stage M2 recherche en TAL/apprentissage automatique

Thierry Hamon hamon at LIMSI.FR
Sat Dec 7 20:19:41 UTC 2013


Date: Thu, 5 Dec 2013 11:07:34 +0100
From: Isabelle Tellier <isabelle.tellier at univ-paris3.fr>
Message-Id: <730D5B02-4640-4012-930A-11F49EBF2FC7 at univ-paris3.fr>
X-url: http://ligm.u-pem.fr
X-url: http://www.lattice.cnrs.fr

sujet de stage M2 recherche en TAL : acquisition d'un analyseur en
dépendances du français médiéval

Dans le cadre du projet ANR Syntactic Reference Corpus of Medieval
French (SRCMF, 2008-2011), un Treebank (une collection d'arbres)
d'analyses en dépendances d'énoncés du français médiéval a été
constitué. Il comprend 260 000 mots (parmi lesquels environ 27 000 têtes
verbales) annotées en étiquettes morpho-syntaxiques et reliés par des
relations de dépendances étiquetées.

L'objectif du stage est d'exploiter ce corpus par apprentissage
automatique afin d'acquérir un analyseur en dépendances du français
médiéval, éventuellement couplé à un étiqueteur morpho-syntaxique. Ces
outils pourront être exploités sur de nouveaux textes. Ils permettront
d'étudier précisément les spécificités grammaticales du français
médiéval, en comparaison avec celles du français contemporain.

Le stage bénéficiera de l'encadrement d'une spécialiste du français
médiéval (Sophie Prévost) et de spécialistes du TAL et de
l'apprentissage automatique (Matthieu Constant et Isabelle Tellier).

Compétences requises :
- niveau M2 ou ingénieur en informatique ou en TAL
- Connaissances (ou au minimum intérêt argumenté) en TAL et en
  apprentissage automatique
- Compétences en programmation

Conditions du stage :
- Rémunération : prime de stage (1/3 du SMIC).
- Durée : 4 à 6 mois en commençant dès que possible en 2014.
- Lieu : le stage sera encadré en collaboration par le LIGM à
  Marne-la-vallée (http://ligm.u-pem.fr) et le Lattice à Montrouge
  (http://www.lattice.cnrs.fr), trajets à prévoir entre les deux lieux

envoyer CV + lettre de motivation à Matthieu Constant
(Matthieu.Constant at u-pem.fr), Sophie Prévost (sophie.prevost at ens.fr),
Isabelle Tellier (isabelle.tellier at univ-paris3.fr)

-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/

ATALA décline toute responsabilité concernant le contenu des
messages diffusés sur la liste LN
-------------------------------------------------------------------------



More information about the Ln mailing list