Sujet de these: Indexation automatique en domaine de specialite

Thierry Hamon thierry.hamon at UNIV-PARIS13.FR
Fri Aug 24 21:42:02 UTC 2012

Date: Wed, 22 Aug 2012 08:52:19 +0200
From: Florian Boudin <florian.boudin at>
Message-ID: <503481A3.2080801 at>

Version française :

L'équipe du Traitement Automatique du Langage Naturel (TALN) du
Laboratoire Informatique de Nantes Atlantique (LINA UMR CNRS 6241) à
l'Université de Nantes propose une thèse de doctorat financée sur un
projet ANR dans les domaines du Traitement Automatique des Langues (TAL)
et de la Recherche d'Information (RI).

Titre : Indexation automatique en domaine de spécialité

L'indexation est au coeur du processus de mise en valeur de
l'information. Pour réaliser cette indexation, l'humain reste la
meilleure ressource grâce à son expertise, son acuité cognitive, sa
subjectivité, mais il se caractérise aussi par sa variabilité et ses
incohérences. Pour aider l'humain ou se substituer à lui, différentes
méthodes statistiques, algébriques, linguistiques d'indexation
automatique ont été mises au point depuis les années 1950. L'objectif de
cette thèse est de proposer une contribution originale à l'indexation
automatique en domaines spécialisés relevant du domaine des sciences
humaines et sociales (SHS). Les problèmes de la désambiguïsation
contextuelle non supervisée et de l'indexation silencieuse seront plus
particulièrement abordés.

Mots clés : Traitement Automatique des Langues, fouille de textes,
indexation automatique, catégorisation, sciences humaines et sociales

Profil recherché : Master informatique (ou équivalent) avec spécialité
en traitement automatique des langues et/ou intelligence artificielle.
Français courant.

Candidature : Envoyer un CV et une lettre de motivation à
   - Béatrice Daille (beatrice.daille at et
   - Florian Boudin (florian.boudin at

Liens utiles :
   - LINA

English version :

Funded PhD position, LINA, Université de Nantes, France

The Department of Computer Science (LINA) of the Université de Nantes,
France, is looking for a PhD student to work in the area of automatic
indexing. The LINA has performed research in many fields of Natural
Language Processing (NLP) and Information Retrieval (IR) for more than
20 years.

Title: Automatic indexing of specialized documents

Document indexing is at the heart of the process to promote
information. To perform indexing, humans are still superior to current
methods but they also are inconsistent in assigning index terms to
documents. Several statistical and linguistic automatic indexing methods
were proposed to tackle this issue. The main objective of this phd
thesis is to study automatic indexing in the social science domain. More
specifically, Unsupervised contextual disambiguation and Automatic
indexing using text categorization will be studied.

Keywords : Natural Language Processing, text mining, automatic indexing,
text categorization, social science

Candidate profile : The successful candidate will have a Master's degree
(or equivalent qualification) in Computer Science with a good background
in Computational Linguistics or Artificial intelligence by the time of
appointment. French fluency is mandatory.

Please send a CV and a cover letter to
  - Béatrice Daille (beatrice.daille at and
  - Florian Boudin (florian.boudin at

Useful links :
   - LINA

Message diffuse par la liste Langage Naturel <LN at>
Informations, abonnement :
English version       : 
Archives                 :

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  :

More information about the Ln mailing list