<html><head></head><body style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space; ">------------------------------------------------------------------------<br>Arabic-L: Mon 18 Oct 2010<br>Moderator: Dilworth Parkinson <<a href="mailto:dil@byu.edu">dil@byu.edu</a>><br>[To post messages to the list, send them to arabic-l@byu.edu]<br>[To unsubscribe, send message from same address you subscribed from to<br><a href="mailto:listserv@byu.edu">listserv@byu.edu</a> with first line reading:<br>            unsubscribe arabic-l                                      ]<br><br>-------------------------Directory------------------------------------<br><br>1) Subject: France Telecom Orange Labs Job<br><br>-------------------------Messages-----------------------------------<br>1)<br>Date: 18 Oct 2010<br>From: <<a href="mailto:malek.boualem@orange-ftgroup.com">malek.boualem@orange-ftgroup.com</a>><br>Subject: France Telecom Orange Labs Job<br><br><div>Offre de postdoc à France Telecom Orange Labs dans le domaine de la</div><div>recherche d’information cross-lingue (CLIR).</div><div> </div><div>Lieu : France Telecom Orange Labs à Lannion (Bretagne).</div><div>Date : dès que possible en fin 2010.</div><div>Durée : 12 mois.</div><div> </div><div>Sujet du postdoc :</div><div>Approches hybrides de traitement des requêtes pour la recherche d'information cross-lingue</div><div> </div><div>Contexte de recherche :</div><div>Certains choix techniques ou méthodologiques en recherche d'information multilingue</div><div>n'ont pas encore atteint un niveau de consensus. Par exemple, il n'est pas trivial</div><div>d'opter pour la traduction des requêtes ou la traduction des contenus. Toutefois,</div><div>il nous semble d'ores et déjà acceptable que la traduction des contenus est plus</div><div>optimale lorsque la quantité d'informations à indexer ainsi que le nombre de langues</div><div>concernées ne sont pas très élevés. Dans le cas contraire, la traduction préalable</div><div>de tous les contenus indexés dans toutes les langues peut poser de réels problèmes d'économie.</div><div>En effet, une petite partie seulement des informations traduites pourrait être réellement exploitée.</div><div> </div><div>Activité du postdoc :</div><div>Cette activité s’inscrit dans le cadre d’un projet de R&D dans le domaine de la recherche</div><div>d’information multimédia et multilingue. Il est proposé d'explorer, mettre en oeuvre</div><div>et évaluer une ou des méthodes hybrides pour le traitement des requêtes en vue d'une recherche cross-lingue.</div><div>Contrairement à une traduction brute de la requête, qui peut échouer compte tenu</div><div>de sa pauvreté syntaxique et contextuelle, ce travail consiste à explorer différentes</div><div>approches dont la combinaison permettrait d'effectuer des pré-traitements ou des</div><div>post-traitements moins systématiques et mieux réfléchis sur les requêtes :</div><div>- Identification dans le requête des composants invariants, traduisibles, translitérables, etc.</div><div>- Prise en compte de scores de confiance et post-édition de la traduction automatique.</div><div>- Exploitation de ressources linguistiques : Wikipédia, entités nommées, lexiques multilingues, thésaurus, etc.</div><div>- Utilisation de l'expansion de requêtes pour la compensation de la couverture lexicale issue de la traduction.</div><div>- Choix et usage de techniques appropriées de traduction pour les différents composants de la requête.</div><div>- Etc.</div><div> </div><div>Profil recherché :</div><div>- Doctorat en informatique ou en linguistique, ayant été soutenu de préférence depuis moins de 18 mois.</div><div>- Bonnes connaissances en TALN et des différentes approches en traduction automatique.</div><div>- Connaissances en recherche d’information et en CLIR.</div><div>- Maîtrise de Linux, Python ou Java, langage de script (bash), C++ serait un plus.</div><div>- Langues : français et anglais (la connaissance d'autres langues serait un atout).</div><div>- Motivation pour la R&D dans un milieu industriel.</div><div> </div><div>Contact :</div><div>Malek Boualem</div><div>France Telecom Orange Labs</div><div>Tél. 02 96 05 29 83</div><div>Email. malek.boualem [ à ] <a href="http://orange-ftgroup.com">orange-ftgroup.com</a></div><div> </div><div>Merci de mettre comme objet du message : candidature au postdoc CLIR</div><div> </div><div>Malek Boualem</div><div>Chef de projet R&D </div><div>France Telecom Orange Labs </div><div>Site de Lannion</div><div>Tél. 02 96 05 29 83</div><div>Mobile. 06 85 71 40 63</div><div><a href="mailto:malek.boualem@orange-ftgroup.com">malek.boualem@orange-ftgroup.com</a></div><div><br></div>--------------------------------------------------------------------------<br>End of Arabic-L: 18 Oct 2010</body></html>