Post-Doctoral Position

Lionel Clément lionel.clement at labri.fr
Thu Apr 1 12:57:06 UTC 2010


Hello,

Here a new Post-Doctoral Position in Bordeaux (France)

thanks to diffuse this announcement ,

Regards
Lionel Clément


(EN FRANCAIS PLUS LOIN)

#########################
Title: Syntactic and Semantic analysis from French texts.
Position type: Post-doctoral Fellow
Functional area: Bordeaux (Talence)
Research theme: Perception, cognition, interaction
Project: SIGNES

When parsing real-world text, we frequently encounter phenomena requiring a detailed and complete analyses; both from a syntactic and a semantic point of view. Examples of these constructions are coordination, ellipsis, comparatives, light verb constructions, causatives, and many others.
In the context of robust parsing, these phenomena are frequently ignored and therefore rarely analyzed correctly. In Data Mining, linguistic analysis - if it is performed at all - is mostly limited to low-level analysis like chunking or partial parsing, but this choice is mostly due to a lack of the expertise and the tools required to perform a deeper text analysis.
Though some of these tools are currently starting to be developed for English, notably in the recent work of Johan Bos and his colleagues, there is at the moment no equivalent for the French language. It is the goal of this research project to remedy this by providing a wide-coverage parsing capable of correctly handling frequent but complex syntactic construction correctly both from a syntactic and a semantic point of view.
  Missions In contrast to the more widely used "shallow" methods used in statistical natural language processing, the post-doc candidate will use a modern theory in computational linguistics (such as LFG, HPSH, categorial grammar or property grammars) and a modern theory in computational semantics (such as DRT, generative lexicon, lambda calculus) to give a deep analysis of modern French text and to produce a semantically and syntactically sound analysis of some of the linguistic phenomena cited above.
The researcher will study the current state-of-the-art to compare, evaluate and improve existing solutions and will implement his analysis experimentally using (and where necessary, extending) one of the systems for detailed syntactic analysis proposed by the community (SXLFG, XLFG5, XLE, LKB, Grail, etc)
Finally, the candidate will make a critical evaluation of his proposed to solutions, both from a syntactic and a semantic point of view, based on a study of the performance on cases found in corpora of written French.

The successful candidate must be familiar with parsing techniques, with constraint-based grammar formalisms such as LFG, HPSG, categorial grammars. A keen interest in natural language syntax and/or natural language semantics is required.
Applicants will have received a PhD in linguistics, or natural language processing.

Knowledge of French is highly desirable.

References : 
Johan Bos, Stephen Clark, Mark Steedman, James R. Curran, Julia Hockenmaier (2004) Wide-coverage semantic representations from a CCG parser.
Pierre Boullier, Sagot Benoît et Clément Lionel (2005), Un analyseur LFG efficace pour le français: SxLfg. In Actes de TALN 05, Dourdan, France (pages 403-408)
Lionel Clément, Alexandra Kinyon (2001), XLFG-an LFG parsing scheme for French, Proceeding of the LFG01
Richard Moot (1999), Grail: an Interactive Parser for Categorial Grammars, in Proceedings of VEXTAL'99, R. Delmonte, ed., University Ca' Foscari, Venice, pp. 255-261

Duration : 12 months from september/october 2010

Application by mail : Lionel.Clement at inria.fr


#############################

Titre:
Analyse Syntaxique et Sémantique en Français écrit.

Objet:
Bourse Post-doctorale

Lieu:
Bordeaux

Durée:
12 mois à partir de Septembre/Octobre 2010

Contact:
Lionel Clément
Projet-Equipe INRIA Signes
lionel.clement at labri.fr

Qui:
Docteur en Linguistique Formelle / en Informatique avec composante Linguistique

Quoi:
L’analyse syntaxique des textes tout-venant se heurte régulièrement à quelques cas complexes pour lesquels il est indispensable d’avoir une analyse fine et complète des phrases en syntaxe et en sémantique. C’est le cas des constructions causatives et factitives, des constructions à verbes supports, des coordonnées, corrélatives et comparatives, des phénomènes d’ellipse, et de bien d’autres encore.

Ces constructions sont régulièrement négligés des systèmes robustes et fournissent des résultats rarement corrects dans les traitements automatiques de documents.

Nous pouvons constater que les techniques du Data Mining se passent le plus souvent de l'analyse fine du contenu textuel des documents pour n’exploiter que les informations de méta-données. Nous observons que les techniques d’analyse robuste en TAL se passent également des analyses fines pour ne retenir qu’une analyse en surface (Chunking, Shallow-parsing). Mais ces technologies ont été choisies à défaut de savoir-faire en matière d’analyse robuste et fine des textes, tant du point de vue des techniques d’analyse que des formalisations linguistiques nécessaires.

Bien que certains de ces outils commencent à être développés, pour l'anglais notamment (dans le récent ouvrage de Johan Bos et ses collègues), il n'y a pour le moment pas d'équivalent pour la langue française. C'est le but de ce projet de recherche de remédier à cela en développant une analyse syntaxique capable de traiter correctement les constructions fréquentes, mais complexes en syntaxe et en sémantique.

Nous voudrions que l’étude soit menée dans un cadre de linguistique formelle issue d’un modèle récent comme les « grammaires d’unification » (par exemple comme LFG ou HPSG, ou les grammaires catégorielles d’unification), les grammaires de propriétés,  etc. L’analyse syntaxique et sémantique des textes se fera en prenant le contre-pied de l’étude habituelle stochastique et de surface, sans toutefois renoncer à une étude d’extraction de corpus ou basée en partie sur des données statistiques par exemple.

Quelques cas de phénomènes linguistiques seront choisis pour leur intérêt théorique et seront appliqués à l’analyse syntaxique et sémantique de textes français issus de gros corpus de textes écrits.

La description linguistique de ces phénomènes se fera par une étude critique de l’état de l’art et sera appliquée de façon expérimentale grâce à l’un des outils d’analyse syntaxique fine proposés par la communauté (SXLFG, XLFG5, XLE, LKB, GRAIL, etc).



More information about the LFG mailing list