Sujet de these: Alignement inter-modalites de corpus comparable monolingue - LINA - U. de Nantes
Thierry Hamon
thierry.hamon at UNIV-PARIS13.FR
Wed May 20 09:40:43 UTC 2009
Date: Tue, 19 May 2009 19:08:34 +0200
From: Beatrice Daille <beatrice.daille at univ-nantes.fr>
Message-ID: <4A12E792.8090900 at univ-nantes.fr>
X-url: http://www.lina.univ-nantes.fr/Doctorats-sujets-de-these-2009-du.html
Titre: Alignement inter-modalités de corpus comparable monolingue
Lieu: Equipe TALN du LINA (Laboratoire d'Informatique de Nantes
Atlantique) - Faculté des Sciences - U. de Nantes
Candidat recherché : Etudiant(e) titulaire d'un M2 informatique (ou
école d'ingénieur) possédant une expérience en Traitement Automatique
des Langues pour postuler sur un financement MESR.
Les candidats intéressés par ce sujet de thèse sont invités à prendre
contact rapidement avec Béatrice Daille et Christine Jacquin en
envoyant un CV détaillé incluant le classement obtenu en M2 sur la
partie théorique. Contact: beatrice.daille at univ-nantes.fr,
christine.jacquin at univ-nantes.fr
Sujet :
L'augmentation de la production de documents d'information de type
textuel ou sonore disponibles (journaux, émissions radiophoniques,
bandes sonores de programmes télévisés, etc.) nécessite le
développement d'outils automatiques de repérage et de navigation dans
ces divers media. Dans un contexte multimedia, à travers ces systèmes,
il doit être possible par exemple, lors de la lecture d'un article de
journal en ligne, d'accéder aussi à des parties d'émissions
radiophoniques correspondant à la lecture en cours. La définition de
descripteurs sonores et leur extraction automatique sont nécessaires
pour donner une représentation structurée du matériau
audio. Parallèlement, les transcriptions d'enregistrements audio (qui
sont de nature écrite) générées par les moteurs de reconnaissance de
la parole sont indispensables pour pouvoir faire le pont avec les
données textuelles cibles afin de permettre une navigation entre des
documents de nature différente. Cette navigation fine entre les
différents médias nécessite l'alignement de « passages » au contenu
similaire au sein de documents de modalités différentes. Ce travail
s'intégrera dans ce contexte et consistera à proposer une méthode
d'alignement pour corpus comparable monolingue multimodal.
Ce sujet de thèse est également référencé au niveau du site Web du
LINA à l'adresse :
http://www.lina.univ-nantes.fr/Doctorats-sujets-de-these-2009-du.html
-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version :
Archives : http://listserv.linguistlist.org/archives/ln.html
http://liste.cines.fr/info/ln
La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion : http://www.atala.org/
-------------------------------------------------------------------------
More information about the Ln
mailing list