Job: Post-Doc Theorie des graphes, TAL--Graph theory, NLP, Toulouse (France)

Thierry Hamon thierry.hamon at UNIV-PARIS13.FR
Mon Jul 27 20:16:46 UTC 2009


Date: Fri, 17 Jul 2009 08:58:06 +0200
From: Laurent Prévot <laurent.prevot at lpl-aix.fr>
Message-ID: <18050b320907162358n2a0f929k890e95ba341afbb8 at mail.gmail.com>
X-url: http://140.112.147.149:81/m3/


Dans le cadre du projet ANR-NSC M3 (Model and measurement of meaning)
nous recherchons un chercheur post-doctorant ayant le profil suivant:

+Nécessaire:
  - Formation en mathématique (Théorie des graphes, Processus
    stochastiques, Algèbre linéaire, Statistiques,...)
  - Bon niveau en informatique (Idéalement programmation Python, ...)

+Les plus:
  - Formation en traitement automatique des langues
  - Connaissance ou intérêt pour le Mandarin

Rémunération: à partir de 2000euros/mois (selon expérience)

Financement : projet bilatéral Franco-Taiwanais (ANR-NSC), Model and
measurement of meaning: A cross-lingual and multi-disciplinary
approach of French and Mandarin verbs based on distance in
paradigmatic graphs. (M3)

Lieu : Toulouse, IRIT (Institut de Recherche en Informatique de
Toulouse)

Début et durée : septembre/décembre 2009 à septembre/décembre 2010

Responsable Scientifique: Bruno Gaume

Contact : gaume--at--irit.fr, laurent.prevot--at--lpl-aix.fr


Argumentaire scientifique

Plusieurs études récentes montrent que pour toute langue naturelle,
son graphe lexical de synonymie (a↔b si et seulement si les mots a et
b sont synonymes) est un « petit monde » (small world) car possédant
des propriétés statistiques bien particulières :

P1 :	La densité en arêtes est faible
P2 :	La moyenne des plus courts chemins entre sommet est petite
P3 :	Il existe des sous ensembles de sommets denses en arêtes
P4 :	La distribution du degré d'incidence des sommets est sans
        échelle: elle suit approximativement une loi de puissance.
Par exemple la propriété P3 indique l’existence de communautés (ou
‘clusters’) : dans un graphe de synonymie, ces clusters reflètent les
concepts de la langue couverte par le graphe.

Il s’agira pour le post-doc de développer des métrologies et les
outils de mesure associés pertinents et efficaces sur les graphes
petits mondes afin de comparer les structures des graphes de synonymie
entre plusieurs langues via les liens de traduction : invariants et
variabilité. Les mesures et outils proposés seront concrètement
évalués sur des graphes de synonymie Mandarin Chinois et Français.

Site du projet: http://140.112.147.149:81/m3/

------------------------------------------------------------------------------------------

1 year Post-doctoral position, starting September 2009

We are looking for a researcher for participating to the ANR-NSC M3
project (Model and measurement of meaning). The requirements are:

 - Solid background in mathematics (Graph Theory ; Stochastic
   processes, linear algebra, Statistics)
 - Good programming skills (Python command is a plus)

+ Plus:
-       Experience and/or Training in Natural Language Processing
-       Knowledge or interest for Mandarin Chinese

Salary: starting from 2000 euros/ month (can be adjusted according to
experience)

Funding: Bilateral project Franco-Taiwanese (ANR-NSC), Model and
measurement of meaning: A cross-lingual and multi-disciplinary
approach of French and Mandarin verbs based on distance in
paradigmatic graphs (M3)

Location : Toulouse IRIT (Institut de Recherche en Informatique de
Toulouse)

Starting time : september-december 2009

Scientific Responsible : Bruno Gaume

Contact : gaume--at--irit.fr & laurent.prevot--at--lpl-aix.fr


Scientific context:

Several studies have shown that lexical synonymy graphs (a synonymy
graph is a graph of words, in which two nodes share an edge if and
only if their corresponding words are synonyms) are small world
graphs. This is robust observation across languages. Small world
graphs have some striking properties:

-       Edge density is low
-       The average shortest path between two vertices is short
-       There are vertices subsets which have high edge density
        (clusters)
-       The incidence degree distribution of vertices follows a power
        law.

In synonymy graphs, clusters correspond to language concepts.

The researcher will have to develop metrologies and corresponding
measuring tools on small world graphs. The objective is to compare the
synonymy graphs structure across language.  The tools developed will
be evaluated on French and Chinese synonymy graphs.

Website: http://140.112.147.149:81/m3/

-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/
-------------------------------------------------------------------------



More information about the Ln mailing list