Job: Postdoc, Analyse Syntaxique et Semantique en Fran çais ecrit

Thierry Hamon thierry.hamon at UNIV-PARIS13.FR
Fri Apr 2 18:42:12 UTC 2010


Date: Thu, 1 Apr 2010 14:52:39 +0200
From: Lionel Clément <lionel.clement at labri.fr>
Message-Id: <5AE2C510-29C1-48A9-B738-D67991849B48 at labri.fr>

(ENGLISH BELOW)

Titre:
Analyse Syntaxique et Sémantique en Français écrit.

Objet:
Bourse Post-doctorale

Lieu:
Bordeaux

Durée:
12 mois à partir de Septembre/Octobre 2010

Contact:
Lionel Clément
Projet-Equipe INRIA Signes
lionel.clement at labri.fr

Qui:
Docteur en Linguistique Formelle / en Informatique avec composante
Linguistique

Quoi:
L’analyse syntaxique des textes tout-venant se heurte régulièrement à
quelques cas complexes pour lesquels il est indispensable d’avoir une
analyse fine et complète des phrases en syntaxe et en
sémantique. C’est le cas des constructions causatives et factitives,
des constructions à verbes supports, des coordonnées, corrélatives et
comparatives, des phénomènes d’ellipse, et de bien d’autres encore.

Ces constructions sont régulièrement négligés des systèmes robustes et
fournissent des résultats rarement corrects dans les traitements
automatiques de documents.

Nous pouvons constater que les techniques du Data Mining se passent le
plus souvent de l'analyse fine du contenu textuel des documents pour
n’exploiter que les informations de méta-données. Nous observons que
les techniques d’analyse robuste en TAL se passent également des
analyses fines pour ne retenir qu’une analyse en surface (Chunking,
Shallow-parsing). Mais ces technologies ont été choisies à défaut de
savoir-faire en matière d’analyse robuste et fine des textes, tant du
point de vue des techniques d’analyse que des formalisations
linguistiques nécessaires.

Bien que certains de ces outils commencent à être développés, pour
l'anglais notamment (dans le récent ouvrage de Johan Bos et ses
collègues), il n'y a pour le moment pas d'équivalent pour la langue
française. C'est le but de ce projet de recherche de remédier à cela
en développant une analyse syntaxique capable de traiter correctement
les constructions fréquentes, mais complexes en syntaxe et en
sémantique.

Nous voudrions que l’étude soit menée dans un cadre de linguistique
formelle issue d’un modèle récent comme les « grammaires d’unification
» (par exemple comme LFG ou HPSG, ou les grammaires catégorielles
d’unification), les grammaires de propriétés, etc. L’analyse
syntaxique et sémantique des textes se fera en prenant le contre-pied
de l’étude habituelle stochastique et de surface, sans toutefois
renoncer à une étude d’extraction de corpus ou basée en partie sur des
données statistiques par exemple.

Quelques cas de phénomènes linguistiques seront choisis pour leur
intérêt théorique et seront appliqués à l’analyse syntaxique et
sémantique de textes français issus de gros corpus de textes écrits.

La description linguistique de ces phénomènes se fera par une étude
critique de l’état de l’art et sera appliquée de façon expérimentale
grâce à l’un des outils d’analyse syntaxique fine proposés par la
communauté (SXLFG, XLFG5, XLE, LKB, GRAIL, etc).




#########################
Title: Syntactic and Semantic analysis from French texts.
Position type: Post-doctoral Fellow
Functional area: Bordeaux (Talence)
Research theme: Perception, cognition, interaction
Project: SIGNES

When parsing real-world text, we frequently encounter phenomena
requiring a detailed and complete analyses; both from a syntactic and
a semantic point of view. Examples of these constructions are
coordination, ellipsis, comparatives, light verb constructions,
causatives, and many others.

In the context of robust parsing, these phenomena are frequently
ignored and therefore rarely analyzed correctly. In Data Mining,
linguistic analysis - if it is performed at all - is mostly limited to
low-level analysis like chunking or partial parsing, but this choice
is mostly due to a lack of the expertise and the tools required to
perform a deeper text analysis.

Though some of these tools are currently starting to be developed for
English, notably in the recent work of Johan Bos and his colleagues,
there is at the moment no equivalent for the French language. It is
the goal of this research project to remedy this by providing a
wide-coverage parsing capable of correctly handling frequent but
complex syntactic construction correctly both from a syntactic and a
semantic point of view.

  Missions In contrast to the more widely used "shallow" methods used
  in statistical natural language processing, the post-doc candidate
  will use a modern theory in computational linguistics (such as LFG,
  HPSH, categorial grammar or property grammars) and a modern theory
  in computational semantics (such as DRT, generative lexicon, lambda
  calculus) to give a deep analysis of modern French text and to
  produce a semantically and syntactically sound analysis of some of
  the linguistic phenomena cited above.

The researcher will study the current state-of-the-art to compare,
evaluate and improve existing solutions and will implement his
analysis experimentally using (and where necessary, extending) one of
the systems for detailed syntactic analysis proposed by the community
(SXLFG, XLFG5, XLE, LKB, Grail, etc)

Finally, the candidate will make a critical evaluation of his proposed
to solutions, both from a syntactic and a semantic point of view,
based on a study of the performance on cases found in corpora of
written French.

The successful candidate must be familiar with parsing techniques,
with constraint-based grammar formalisms such as LFG, HPSG, categorial
grammars. A keen interest in natural language syntax and/or natural
language semantics is required.
Applicants will have received a PhD in linguistics, or natural
language processing.
Knowledge of French is highly desirable.

References : 
Johan Bos, Stephen Clark, Mark Steedman, James R. Curran, Julia
Hockenmaier (2004) Wide-coverage semantic representations from a CCG
parser.

Pierre Boullier, Sagot Benoît et Clément Lionel (2005), Un analyseur
LFG efficace pour le français: SxLfg. In Actes de TALN 05, Dourdan,
France (pages 403-408)

Lionel Clément, Alexandra Kinyon (2001), XLFG-an LFG parsing scheme
for French, Proceeding of the LFG01

Richard Moot (1999), Grail: an Interactive Parser for Categorial
Grammars, in Proceedings of VEXTAL'99, R. Delmonte, ed., University
Ca' Foscari, Venice, pp. 255-261

Duration : 12 months from september/october

Application by mail : Lionel.Clement at inria.fr

-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/
-------------------------------------------------------------------------



More information about the Ln mailing list