<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html4/strict.dtd">
<html>
<head>
</head>







<body style="background-color: #fff;">
<span style="display:none"> </span>

<!--~-|**|PrettyHtmlStartT|**|-~-->
<div id="ygrp-mlmsg" style="position:relative;">
  <div id="ygrp-msg" style="z-index: 1;">
<!--~-|**|PrettyHtmlEndT|**|-~-->

    <div id="ygrp-text" >
      
      
      <p><div>*** Proposition de stage : acquisition semi-automatique de patrons caractéristiques à partir de textes ***</div><div><br></div><div><br></div><div>* Descriptif :</div><div><br></div><div><div>Le stage vise à extraire semi-automatiquement des patrons syntaxico-sémantiques à partir de textes. Cette tâche a plusieurs applications possibles : les patrons peuvent  servir à repérer des éléments précis dans un texte (tâche classique d'extraction d'information) mais ils peuvent aussi servir de base à des travaux plus linguistiques, visant par exemple à caractériser des textes en fonction de particularités qui ne sont pas directement observables. </div><div><br></div><div>Les outils existants reposent essentiellement sur des patrons très proches des formes de surface (Hearst 1992) ou sur des méthodes à base d'apprentissage produisant de très nombreux patrons qui sont ensuite difficiles à trier et à analyser (Quiniou et al., 2012). Ces études ont toutefois mis en avant des approches efficaces et reposant sur un certain nombre de points communs (préanalyse du texte par un analyseur morphosyntaxique, repérage de séquences continues ou non, contraintes sur le niveau d'analyse possible). Pour aller plus loin, il semble nécessaire de proposer des approches interactives, de sorte que l'analyste puisse spécifier dynamiquemlent ses besoins et ainsi guider au mieux l'analyse. </div><div><br></div><div><br></div><div>* Déroulement du stage</div><div><br></div><div>Le stage se déroulera suivant plusieurs étapes :</div><div><br></div><div>- état de l'art et choix d'une approche adéquate</div><div>- implémentation d'un algorithme interactif (en réutilisant si possible un logiciel existant pour l'acquisition des patrons eux-mêmes)</div><div>- validation sur une tâche à préciser (la tâche visée et le corpus seront discutés au début du stage)</div><div>- rédaction d'un rapport de stage</div><div><br></div><div><br></div><div><div>* Références</div></div><div><br></div><div><br></div><div><div><div>- Marti Hearst (1992). "Automatic Acquisition of Hyponyms from Large Text Corpora." In: Proceedings of the 14th International Conference on Computational Linguistics (COLING-1992). doi:10.3115/992133.992154. </div><div><br></div><div>- Solen Quiniou, Peggy Cellier, Thierry Charnois, Dominique Legallois (2012). What About Sequential Data Mining Techniques to Identify Linguistic Patterns for Stylistics? Proceedings of Cicling. <a href="http://hal.archives-ouvertes.fr/hal-00675578">http://hal.archives-ouvertes.fr/hal-00675578</a>. </div></div></div><div><br></div><div><br></div><div><br></div><div>* Compétences requises</div><div><br></div><div>- bonne connaissance d'un langage de programmation (java, perl ou python seraient particulièrement appréciés)</div><div>- intérêt pour le traitement automatique du langage naturel</div><div>- intérêt pour l'intelligence artificielle, en particulier l'apprentissage automatique</div><div>- qualité de rédaction en français et en anglais</div><div><br></div><div><br></div><div>* Conditions :</div><div><br></div><div>Le stage se déroulera au laboratoire Lattice (à Montrouge, <a href="http://www.lattice.cnrs.fr/">http://www.lattice.cnrs.fr/</a>) pendant 6 mois, à partir d'avril 2013. Ce stage est indemnisé grâce au soutien du laboratoire d'excellence "Empirical Foundations of Linguistics" (labex EFL, <a href="http://www.labex-efl.org/">http://www.labex-efl.org/</a>). Le stage fait partie d'un projet plus large visant à étudier la contribution de sources de connaissances pour l'extraction d'information, mené en commun entre le LATTICE et le LIPN dans le cadre du labex EFL.  </div><div><br></div><div><div>* Comment postuler ?</div><div><br></div><div>Envoyer par mail un CV et une lettre de motivation à Thierry Poibeau (<a href="mailto:prenom.nom@ens.fr">prenom.nom@ens.fr</a>) avant le 7 février 2013. Indiquer "stage : acquisition semi-automatique de patrons caractéristiques à partir de textes" comme sujet du mail. </div><div><br></div><div><br></div><div><br></div></div><div><br></div></div><div><br></div></p>

    </div>
     

    <!--~-|**|PrettyHtmlStart|**|-~-->
    <div style="color: #fff; height: 0;">__._,_.___</div>

        
  
   
    <div id="ygrp-actbar" style="clear: both; margin-bottom: 10px; white-space: nowrap; color: #666; padding-top: 15px;">
      <div>
        <a href="mailto:thierry.poibeau@ens.fr?subject=Re%A0%3A%20Proposition%20de%20stage%20%3A%20acquisition%20semi-automatique%20de%20patrons%20caract%E9ristiques%20%E0%20partir%20de%20textes" style="margin-right: 0; padding-right: 0;">
          Répondre à <span style="font-weight: 700;">expéditeur</span></a> |
        <a href="mailto:parislinguists@yahoogroupes.fr?subject=Re%A0%3A%20Proposition%20de%20stage%20%3A%20acquisition%20semi-automatique%20de%20patrons%20caract%E9ristiques%20%E0%20partir%20de%20textes">
          Répondre à <span style="font-weight: 700;">groupe</span></a> |
                  <a href="http://fr.groups.yahoo.com/group/parislinguists/post;_ylc=X3oDMTJwMHBwdXVrBF9TAzk3NDkwNDY4BGdycElkAzMxNDkxMjQEZ3Jwc3BJZAMyMTIzODEyNTI4BG1zZ0lkAzQzODYEc2VjA2Z0cgRzbGsDcnBseQRzdGltZQMxMzU5MTUyNzQx?act=reply&messageNum=4386">Répondre <span style="font-weight: 700;">en mode Web</span></a> |
                <a href="http://fr.groups.yahoo.com/group/parislinguists/post;_ylc=X3oDMTJlbHYwOTNlBF9TAzk3NDkwNDY4BGdycElkAzMxNDkxMjQEZ3Jwc3BJZAMyMTIzODEyNTI4BHNlYwNmdHIEc2xrA250cGMEc3RpbWUDMTM1OTE1Mjc0MQ--" style="font-weight: 700;">Nouvelle discussion</a>
      </div>

                <a href="http://fr.groups.yahoo.com/group/parislinguists/message/4386;_ylc=X3oDMTM0MGdyNHQxBF9TAzk3NDkwNDY4BGdycElkAzMxNDkxMjQEZ3Jwc3BJZAMyMTIzODEyNTI4BG1zZ0lkAzQzODYEc2VjA2Z0cgRzbGsDdnRwYwRzdGltZQMxMzU5MTUyNzQxBHRwY0lkAzQzODY-">Toute la discussion</a>
          (<span style="font-weight: 700;">1</span>)
          </div> 
<!------- Start Nav Bar ------>
<!-- |**|begin egp html banner|**| -->
<!-- |**|end egp html banner|**| -->

<!-- |**|begin egp html banner|**| -->
<div id="ygrp-vital" style="background-color: #e0ecee; font-family: Verdana; font-size: 10px; margin-bottom: 10px; padding: 10px;">
      <span id="vithd" style="font-weight: bold; color: #333; text-transform: uppercase; ">Activités récentes:</span>

    <ul style="list-style-type: none; margin: 0; padding: 0; display: inline;">
            <li style="border-right: 1px solid #000; font-weight: 700; display: inline; padding: 0 5px; margin-left: 0;">
      <span class="cat"><a href="http://fr.groups.yahoo.com/group/parislinguists/members;_ylc=X3oDMTJmdXY5OHUwBF9TAzk3NDkwNDY4BGdycElkAzMxNDkxMjQEZ3Jwc3BJZAMyMTIzODEyNTI4BHNlYwN2dGwEc2xrA3ZtYnJzBHN0aW1lAzEzNTkxNTI3NDE-?o=6" style="text-decoration: none;">Nouveaux membres</a></span>
      <span class="ct" style="color: #ff7900;">5</span>
    </li>
                                              </ul>
    
  <div style="clear: both; padding-top: 2px; color: #1e66ae;">
    <a href="http://fr.groups.yahoo.com/group/parislinguists;_ylc=X3oDMTJlZzU5ZGoyBF9TAzk3NDkwNDY4BGdycElkAzMxNDkxMjQEZ3Jwc3BJZAMyMTIzODEyNTI4BHNlYwN2dGwEc2xrA3ZnaHAEc3RpbWUDMTM1OTE1Mjc0MQ--" style="text-decoration: none;">Aller sur votre groupe</a>
  </div>
</div>

      <div id="ygrp-grfd" style="font-family: Verdana; font-size: 12px; padding: 15px 0;">
      
<!-- |**|begin egp html banner|**| -->

      Pour se desinscire, envoyer un mel à parislinguists-unsubscribe@yahoogroups.com<BR>
Pour s'inscrire, envoyer un mel à parislinguists-subscribe@yahoogroups.com      
<!-- |**|end egp html banner|**| -->

    </div>
  
<div id="ft" style="font-family: Arial; font-size: 11px; margin-top: 5px; padding: 0 2px 0 0; clear: both;">
  <a href="http://fr.groups.yahoo.com/;_ylc=X3oDMTJka2w5ZHZtBF9TAzk3NDkwNDY2BGdycElkAzMxNDkxMjQEZ3Jwc3BJZAMyMTIzODEyNTI4BHNlYwNmdHIEc2xrA2dmcARzdGltZQMxMzU5MTUyNzQx" style="float: left;"><img src="http://l.yimg.com/a/i/us/yg/logo/fr.gif" height="19" width="145" alt="Yahoo! Groupes" style="border: 0;"/></a>
  <div style="color: #747575; float: right;">Passer Ã : <a href="mailto:parislinguists-traditional@yahoogroupes.fr?subject=Changer le format : Traditionnel" style="text-decoration: none;">Texte seulement</a>, <a href="mailto:parislinguists-digest@yahoogroupes.fr?subject=Messages du groupe : Résumé" class="margin-rt" style="text-decoration: none;">Résumé du jour</a> • <a href="mailto:parislinguists-desabonnement@yahoogroupes.fr?subject=Désinscription" style="text-decoration: none;">Désinscription</a> • <a href="http://fr.docs.yahoo.com/info/utos.html" style="text-decoration: none;">Conditions d’utilisation</a></div>
</div>

<!-- |**|end egp html banner|**| -->

  </div> <!-- ygrp-msg -->

  <!-- Sponsor -->
  <!-- |**|begin egp html banner|**| -->
  <div id="ygrp-sponsor" style="width:160px; float:right; clear:none; margin:0 0 25px 0; background: #fff;">

<!-- Start Recommendations -->
<div id="ygrp-reco">
     </div>
<!-- End Recommendations -->



  </div>   <!-- |**|end egp html banner|**| -->

  <div style="clear:both; color: #FFF; font-size:1px;">.</div>
</div>

  <img src="http://geo.yahoo.com/serv?s=97490468/grpId=3149124/grpspId=2123812528/msgId=4386/stime=1359152741" width="1" height="1"> <br>

<div style="color: #fff; height: 0;">__,_._,___</div>
<!--~-|**|PrettyHtmlEnd|**|-~-->

</body>

<!--~-|**|PrettyHtmlStart|**|-~-->
<head>
  <style type="text/css">
  <!--
  #ygrp-mkp {
  border: 1px solid #d8d8d8;
  font-family: Arial;
  margin: 10px 0;
  padding: 0 10px;
}

#ygrp-mkp hr {
  border: 1px solid #d8d8d8;
}

#ygrp-mkp #hd {
  color: #628c2a;
  font-size: 85%;
  font-weight: 700;
  line-height: 122%;
  margin: 10px 0;
}

#ygrp-mkp #ads {
  margin-bottom: 10px;
}

#ygrp-mkp .ad {
  padding: 0 0;
}

#ygrp-mkp .ad p {
  margin: 0;
}

#ygrp-mkp .ad a {
  color: #0000ff;
  text-decoration: none;
}
  #ygrp-sponsor #ygrp-lc {
  font-family: Arial;
}

#ygrp-sponsor #ygrp-lc #hd {
  margin: 10px 0px;
  font-weight: 700;
  font-size: 78%;
  line-height: 122%;
}

#ygrp-sponsor #ygrp-lc .ad {
  margin-bottom: 10px;
  padding: 0 0;
}

  a {
    color: #1e66ae;
  }

  #actions {
    font-family: Verdana;
    font-size: 11px;
    padding: 10px 0;
  }

  #activity {
    background-color: #e0ecee;
    float: left;
    font-family: Verdana;
    font-size: 10px;
    padding: 10px;
  }

  #activity span {
    font-weight: 700;
  }

  #activity span:first-child {
    text-transform: uppercase;
  }

  #activity span a {
    color: #5085b6;
    text-decoration: none;
  }

  #activity span span {
    color: #ff7900;
  }

  #activity span .underline {
    text-decoration: underline;
  }

  .attach {
    clear: both;
    display: table;
    font-family: Arial;
    font-size: 12px;
    padding: 10px 0;
    width: 400px;
  }

  .attach div a {
    text-decoration: none;
  }

  .attach img {
    border: none;
    padding-right: 5px;
  }

  .attach label {
    display: block;
    margin-bottom: 5px;
  }

  .attach label a {
    text-decoration: none;
  }
  
  blockquote {
    margin: 0 0 0 4px;
  }

  .bold {
    font-family: Arial;
    font-size: 13px;
    font-weight: 700;
  }

  .bold a {
    text-decoration: none;
  }

  dd.last p a {
    font-family: Verdana;
    font-weight: 700;
  }

  dd.last p span {
    margin-right: 10px;
    font-family: Verdana;
    font-weight: 700;
  }

  dd.last p span.yshortcuts {
    margin-right: 0;
  }

  div.attach-table div div a {
    text-decoration: none;
  }

  div.attach-table {
    width: 400px;
  }

  div.file-title a, div.file-title a:active, div.file-title a:hover, div.file-title a:visited {
    text-decoration: none;
  }

  div.photo-title a, div.photo-title a:active, div.photo-title a:hover, div.photo-title a:visited {
    text-decoration: none;
  }

  div#ygrp-mlmsg #ygrp-msg p a span.yshortcuts {
    font-family: Verdana;
    font-size: 10px;
    font-weight: normal;
  }

  .green {
    color: #628c2a;
  }

  .MsoNormal {
    margin: 0 0 0 0;
  }

  o {
    font-size: 0;
  }

  #photos div {
    float: left;
    width: 72px;
  }

  #photos div div {
    border: 1px solid #666666;
    height: 62px;
    overflow: hidden;
    width: 62px;
  }

  #photos div label {
    color: #666666;
    font-size: 10px;
    overflow: hidden;
    text-align: center;
    white-space: nowrap;
    width: 64px;
  }

  #reco-category {
    font-size: 77%;
  }

  #reco-desc {
    font-size: 77%;
  }

  .replbq {
    margin: 4px;
  }

  #ygrp-actbar div a:first-child {
   /* border-right: 0px solid #000;*/
    margin-right: 2px;
    padding-right: 5px;
  }

  #ygrp-mlmsg {
    font-size: 13px;
    font-family: Arial, helvetica,clean, sans-serif;
    *font-size: small;
    *font: x-small;
  }

  #ygrp-mlmsg table {
    font-size: inherit;
    font: 100%;
  }

  #ygrp-mlmsg select, input, textarea {
    font: 99% Arial, Helvetica, clean, sans-serif;
  }

  #ygrp-mlmsg pre, code {
    font:115% monospace;
    *font-size:100%;
  }

  #ygrp-mlmsg * {
    line-height: 1.22em;
  }

  #ygrp-mlmsg #logo {
    padding-bottom: 10px;
  }

  #ygrp-mlmsg a {
    color: #1E66AE;
  }

  #ygrp-msg p a {
    font-family: Verdana;
  }

  #ygrp-msg p#attach-count span {
    color: #1E66AE;
    font-weight: 700;
  }

  #ygrp-reco #reco-head {
    color: #ff7900;
    font-weight: 700;
  }

  #ygrp-reco {
    margin-bottom: 20px;
    padding: 0px;
  }

  #ygrp-sponsor #ov li a {
    font-size: 130%;
    text-decoration: none;
  }

  #ygrp-sponsor #ov li {
    font-size: 77%;
    list-style-type: square;
    padding: 6px 0;
  } 

  #ygrp-sponsor #ov ul {
    margin: 0;
    padding: 0 0 0 8px;
  }

  #ygrp-text {
    font-family: Georgia;
  }

  #ygrp-text p {
    margin: 0 0 1em 0;
  }

  #ygrp-text tt {
    font-size: 120%;
  }

  #ygrp-vital ul li:last-child {
    border-right: none !important; 
  } 
  -->
  </style>
</head>

<!--~-|**|PrettyHtmlEnd|**|-~-->
</html>
<!-- end group email -->