Job: Stage M2 recherche en Traitement Automatique de Langue, Telecom Bretagne

Thierry Hamon thierry.hamon at UNIV-PARIS13.FR
Wed Oct 26 09:58:37 UTC 2011


Date: Tue, 25 Oct 2011 12:59:21 +0200
From: Yannis Haralambous <yannis.haralambous at telecom-bretagne.eu>
Message-Id: <86FA1774-1DBF-4909-B5A0-5096E816B90D at telecom-bretagne.eu>
X-url: http://www.telecom-bretagne.eu
X-url: http://www.lab-sticc.fr/

Sujet du stage M2 (5-6 mois) : Un langage contrôle pour les Instructions
Nautiques du SHOM

Responsables : Yannis Haralambous (Télécom Bretagne / Lab-STICC),
Georges Dubois (SHOM)

Laboratoire d'accueil : Télécom Bretagne http://www.telecom-bretagne.eu
et Lab-STICC, pôle CID, équipe DECIDE http://www.lab-sticc.fr/

Les langages contrôlés sont des langages artificiels utilisant un
sous-ensemble du vocabulaire, des formes morphologiques, des
constructions grammaticales et des interprétations sémantiques d’une
langue naturelle (dans notre cas : le français). En quelque sorte ils
constituent le pont entre les langages formels et les langues
naturelles. De ce fait, ils remplissent la fonction de communication du
médium texte tout en étant rigoureux et analysables par la machine sans
ambiguïté.

En particulier, ils peuvent être utilisés pour faciliter l’alimentation
de bases de connaissances, dans le cadre d’une interface homme-machine
au moment de la saisie du texte.

Le Service Hydrographique et Océanographique de la Marine (SHOM) publie
depuis plusieurs années les Instructions Nautiques, un recueil de
renseignements généraux, nautiques et réglementaires, destinés aux
navigateurs. Ces informations complètent les cartes marines. Elles sont
obligatoires à bord des navires de commerce et de pêche.

L’Organisation Hydrographique Internationale (OHI) a publié des normes
spécifiant l’échange de données liées à la navigation et notamment un
modèle universel de données hydrographiques (norme S-100, janvier 2010).

Le but de ce stage est d’élaborer un langage contrôlé qui couvre les
besoins des Instructions Nautiques et qui permette l’alimentation de
bases de connaissances conformes à la norme S-100. Comment faire évoluer
le langage selon les évolutions des ontologies concernées et
l'alimentation de la base de connaissances ?

Dans le contexte d’une thèse CIFRE, deux applications seront envisagées
: (a) une interface homme-machine qui analyse en temps réel le texte
saisi par l’opérateur des Instructions Nautiques et qui valide son
appartenance au langage contrôlé ; (b) un outil semi-automatique de
traduction des documents existants dans le langage contrôlé.

Ce stage se concentrera sur la faisabilité d’un langage contrôlé qui
satisfasse les deux contraintes : exploitation optimale du contenu
traditionnel des Instructions Nautiques et adéquation avec la norme
S-100. Un prototype de langage sera élaboré, accompagné des algorithmes
d’extraction de connaissances et d’alimentation d’une base de
connaissance conforme à la norme S-100.

Ce stage est proposé en collaboration avec le SHOM.

Pour candidater : envoyer LM+CV à 
yannis.haralambous [ à ] telecom-bretagne.eu

-------------------------------------------------------------------------
Message diffuse par la liste Langage Naturel <LN at cines.fr>
Informations, abonnement : http://www.atala.org/article.php3?id_article=48
English version       : 
Archives                 : http://listserv.linguistlist.org/archives/ln.html
                                http://liste.cines.fr/info/ln

La liste LN est parrainee par l'ATALA (Association pour le Traitement
Automatique des Langues)
Information et adhesion  : http://www.atala.org/
-------------------------------------------------------------------------



More information about the Ln mailing list