<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html4/strict.dtd">
<html>
<head>
</head>
<body style="background-color: #fff;">
<span style="display:none"> </span>
<!--~-|**|PrettyHtmlStartT|**|-~-->
<div id="ygrp-mlmsg" style="position:relative;">
<div id="ygrp-msg" style="z-index: 1;">
<!--~-|**|PrettyHtmlEndT|**|-~-->
<div id="ygrp-text" >
<p><div dir="ltr"><div style="color:rgb(0,0,0);font-family:'times new roman','new york',times,serif;font-size:16px;"><span style="font-size:12pt;">Chers amis, professeurs, étudiants, collègues,<br><br>J'ai le plaisir de vous inviter à la soutenance de ma thèse, intitulée </span></div>
<div style="color:rgb(0,0,0);font-family:'times new roman','new york',times,serif;font-size:16px;"><font face="times new roman, new york, times, serif">"Unsupervised Word Segmentation and Wordhood Assessment: t</font>he case for Mandarin Chinese".</div>
<div style="color:rgb(0,0,0);font-family:'times new roman','new york',times,serif;font-size:16px;"><font face="times new roman, new york, times, serif">(Segmentation en mots non-supervisée et estimation de la lexicalité : le cas du mandarin)</font></div>
<div style="color:rgb(0,0,0);font-family:'times new roman','new york',times,serif;font-size:16px;"><font face="times new roman, new york, times, serif"><br></font></div><div style="color:rgb(0,0,0);font-family:'times new roman','new york',times,serif;font-size:16px;">
<font face="times new roman, new york, times, serif">Je l'ai menée au sein de l'équipe Alpage, à l'université Paris-Diderot/INRIA </font></div><div style="color:rgb(0,0,0);font-family:'times new roman','new york',times,serif;font-size:16px;">
<font face="times new roman, new york, times, serif">et la soutiendrai le 19 <span class id="OBJ_PREFIX_DWT91_com_zimbra_date" style="color:rgb(0,0,139);"><span class id="OBJ_PREFIX_DWT64_com_zimbra_date">décembre 2013</span></span> à partir de 9h30, dans la salle des thèses de Paris 7.</font></div>
<div style="color:rgb(0,0,0);font-family:'times new roman','new york',times,serif;font-size:16px;"><font face="times new roman, new york, times, serif">Salle des thèses 580F (Halle aux Farines)</font></div>
<div style="color:rgb(0,0,0);font-family:'times new roman','new york',times,serif;font-size:16px;"><font face="times new roman, new york, times, serif">10 rue Françoise Dolto</font></div><div style="color:rgb(0,0,0);font-family:'times new roman','new york',times,serif;font-size:16px;">
<font face="times new roman, new york, times, serif">75013 Paris </font></div><div style="color:rgb(0,0,0);font-family:'times new roman','new york',times,serif;font-size:16px;"><font face="times new roman, new york, times, serif">(plan : <span class id="OBJ_PREFIX_DWT92_com_zimbra_url" style="color:rgb(0,0,139);"><span class id="OBJ_PREFIX_DWT65_com_zimbra_url"><a target="_blank" href="http://www.openstreetmap.org/?mlat=48.8295&mlon=2.3825#map=16/48.8295/2.3825" style="color:rgb(0,0,139);text-decoration:none;">http://www.openstreetmap.org/?mlat=48.8295&mlon=2.3825#map=16/48.8295/2.3825</a></span></span> )</font></div>
<div style="color:rgb(0,0,0);font-family:'times new roman','new york',times,serif;font-size:16px;"><font face="times new roman, new york, times, serif">Prendre l'entrée la plus proche de la Seine.</font></div>
<div style="color:rgb(0,0,0);font-family:'times new roman','new york',times,serif;font-size:16px;"><font face="times new roman, new york, times, serif"><br></font></div><div style="color:rgb(0,0,0);font-family:'times new roman','new york',times,serif;font-size:16px;">
<font face="times new roman, new york, times, serif">La soutenance sera suivie d'un pot auquel vous êtes également conviés.</font></div><div style="color:rgb(0,0,0);font-family:'times new roman','new york',times,serif;font-size:16px;">
<font face="times new roman, new york, times, serif"><br></font></div><div style="color:rgb(0,0,0);font-family:'times new roman','new york',times,serif;font-size:16px;"><font face="times new roman, new york, times, serif">Bien cordialement,</font></div>
<div style="color:rgb(0,0,0);font-family:'times new roman','new york',times,serif;font-size:16px;"><font face="times new roman, new york, times, serif">Pierre Magistry</font></div><div style="color:rgb(0,0,0);font-family:'times new roman','new york',times,serif;font-size:16px;">
<font face="times new roman, new york, times, serif">----</font></div><div style="color:rgb(0,0,0);font-family:'times new roman','new york',times,serif;font-size:16px;"><font face="times new roman, new york, times, serif">Le jury de soutenance sera composé de:</font></div>
<div style="color:rgb(0,0,0);font-family:'times new roman','new york',times,serif;font-size:16px;">PR. 謝舒凱 Hsieh Shukai (rapporteur) - National Taiwan University</div><div style="color:rgb(0,0,0);font-family:'times new roman','new york',times,serif;font-size:16px;">
PR. Sylvain Kahane (directeur) - Université Paris 10 Nanterre, MoDyCo</div><div style="color:rgb(0,0,0);font-family:'times new roman','new york',times,serif;font-size:16px;">PR. Yves Lepage (rapporteur) - Waseda University</div>
<div style="color:rgb(0,0,0);font-family:'times new roman','new york',times,serif;font-size:16px;"><font face="times new roman, new york, times, serif">PR. Marie-Claude Paris (co-directrice) - Université Paris Diderot, LLF</font></div>
<div style="color:rgb(0,0,0);font-family:'times new roman','new york',times,serif;font-size:16px;"><font face="times new roman, new york, times, serif">DR. Benoit Sagot (co-directeur) - INRIA, ALPAGE</font></div>
<div style="color:rgb(0,0,0);font-family:'times new roman','new york',times,serif;font-size:16px;"><font face="times new roman, new york, times, serif">DR. Pierre Zweigenbaum (président) - CNRS, LIMSI</font></div>
<div style="color:rgb(0,0,0);font-family:'times new roman','new york',times,serif;font-size:16px;"><font face="times new roman, new york, times, serif"><br></font></div><div style="color:rgb(0,0,0);font-family:'times new roman','new york',times,serif;font-size:16px;">
<font face="times new roman, new york, times, serif">----</font></div><div style="color:rgb(0,0,0);font-family:'times new roman','new york',times,serif;font-size:16px;"><font face="times new roman, new york, times, serif">Résumé de la thèse :</font></div>
<div style="color:rgb(0,0,0);font-family:'times new roman','new york',times,serif;font-size:16px;"><font face="times new roman, new york, times, serif"><br></font></div><div style="color:rgb(0,0,0);font-family:'times new roman','new york',times,serif;font-size:16px;">
<font face="times new roman, new york, times, serif">Ce mémoire traite de la segmentation non-supervisée en mots et de l'évaluation de la «lexicalité» des formes. Le chinois moderne standard (mandarin) est choisi pour les expériences et évaluations.</font></div>
<div style="color:rgb(0,0,0);font-family:'times new roman','new york',times,serif;font-size:16px;"><font face="times new roman, new york, times, serif"><br></font></div><div style="color:rgb(0,0,0);font-family:'times new roman','new york',times,serif;font-size:16px;">
<font face="times new roman, new york, times, serif">La première partie porte sur les aspects linguistiques. Elle présente les critères couramment utilisés pour définir le «mot» en linguistique chinoise et en montre les limites au travers d'une discussion de linguistique générale, abordant notamment la question des «expressions multi-mots» et son lien avec les problèmes de segmentation en mots.</font></div>
<div style="color:rgb(0,0,0);font-family:'times new roman','new york',times,serif;font-size:16px;"><font face="times new roman, new york, times, serif"><br></font></div><div style="color:rgb(0,0,0);font-family:'times new roman','new york',times,serif;font-size:16px;">
<font face="times new roman, new york, times, serif">Nous présentons ensuite l'historique du développement de la Segmentation en Mot du Chinois (CWS) comme une tâche typique en TAL, et défendons l'idée qu'une part d'arbitraire dans l'annotation des corpus d'évaluation favorise artificiellement les systèmes d'apprentissage supervisés alors que nous considérons les systèmes non-supervisés d'un plus grand intérêt pour la linguistique.</font></div>
<div style="color:rgb(0,0,0);font-family:'times new roman','new york',times,serif;font-size:16px;"><font face="times new roman, new york, times, serif"><br></font></div><div style="color:rgb(0,0,0);font-family:'times new roman','new york',times,serif;font-size:16px;">
<font face="times new roman, new york, times, serif">La première partie nous amène à fonder notre définition de la lexicalité sur deux critères: une forte autonomie de combinaison et un haut degré d'appartenance à une classe distributionnelle.</font></div>
<div style="color:rgb(0,0,0);font-family:'times new roman','new york',times,serif;font-size:16px;"><font face="times new roman, new york, times, serif"><br></font></div><div style="color:rgb(0,0,0);font-family:'times new roman','new york',times,serif;font-size:16px;">
<font face="times new roman, new york, times, serif">La seconde partie présente une méthode non-supervisée pour évaluer l'autonomie de combinaison des formes inspirée par les hypothèses de Harris. Avec un algorithme de segmentation simple et rapide basé uniquement sur cette mesure, nous obtenons des résultats proches de l'état de l'art. Nous discutons ensuite de l'importance des pré-traitements et présentons des expériences utilisant le principe de la Longueur de Description Minimale (MDL) pour améliorer nos résultats.</font></div>
<div style="color:rgb(0,0,0);font-family:'times new roman','new york',times,serif;font-size:16px;"><font face="times new roman, new york, times, serif"><br></font></div><div style="color:rgb(0,0,0);font-family:'times new roman','new york',times,serif;font-size:16px;">
<font face="times new roman, new york, times, serif">Enfin, nous proposons une méthode et des outils pour une évaluation plus qualitative des analyses fournies par notre système. Nous présentons aussi quelques résultats préliminaires sur d'autres langues qui montrent la généricité de notre méthode.</font></div>
</div>
</p>
</div>
<!--~-|**|PrettyHtmlStart|**|-~-->
<div style="color: #fff; height: 0;">__._,_.___</div>
<div id="ygrp-actbar" style="clear: both; margin-bottom: 10px; white-space: nowrap; color: #666; padding-top: 15px;">
<div>
<a href="mailto:pmagistry@gmail.com?subject=Re%A0%3A%20Soutenance%20de%20th%C3%A8se%3A%20Pierre%20Magistry%2C%2019%2F12%20%C3%A0%209h30" style="margin-right: 0; padding-right: 0;">
Répondre à <span style="font-weight: 700;">expéditeur</span></a> |
<a href="mailto:parislinguists@yahoogroupes.fr?subject=Re%A0%3A%20Soutenance%20de%20th%C3%A8se%3A%20Pierre%20Magistry%2C%2019%2F12%20%C3%A0%209h30">
Répondre à <span style="font-weight: 700;">groupe</span></a> |
<a href="http://fr.groups.yahoo.com/group/parislinguists/post;_ylc=X3oDMTJwMWxrZWNoBF9TAzk3NDkwNDY4BGdycElkAzMxNDkxMjQEZ3Jwc3BJZAMyMTIzODEyNTI4BG1zZ0lkAzUwMTcEc2VjA2Z0cgRzbGsDcnBseQRzdGltZQMxMzg2NjE1MDUw?act=reply&messageNum=5017">Répondre <span style="font-weight: 700;">en mode Web</span></a> |
<a href="http://fr.groups.yahoo.com/group/parislinguists/post;_ylc=X3oDMTJlMjFvbmRsBF9TAzk3NDkwNDY4BGdycElkAzMxNDkxMjQEZ3Jwc3BJZAMyMTIzODEyNTI4BHNlYwNmdHIEc2xrA250cGMEc3RpbWUDMTM4NjYxNTA1MA--" style="font-weight: 700;">Nouvelle discussion</a>
</div>
<a href="http://fr.groups.yahoo.com/group/parislinguists/message/5017;_ylc=X3oDMTM0cDlzOW9yBF9TAzk3NDkwNDY4BGdycElkAzMxNDkxMjQEZ3Jwc3BJZAMyMTIzODEyNTI4BG1zZ0lkAzUwMTcEc2VjA2Z0cgRzbGsDdnRwYwRzdGltZQMxMzg2NjE1MDUwBHRwY0lkAzUwMTc-">Toute la discussion</a>
(<span style="font-weight: 700;">1</span>)
</div>
<!------- Start Nav Bar ------>
<!-- |**|begin egp html banner|**| -->
<!-- |**|end egp html banner|**| -->
<!-- |**|begin egp html banner|**| -->
<div id="ygrp-vital" style="background-color: #e0ecee; font-family: Verdana; font-size: 10px; margin-bottom: 10px; padding: 10px;">
<span id="vithd" style="font-weight: bold; color: #333; text-transform: uppercase; ">Activités récentes:</span>
<ul style="list-style-type: none; margin: 0; padding: 0; display: inline;">
<li style="border-right: 1px solid #000; font-weight: 700; display: inline; padding: 0 5px; margin-left: 0;">
<span class="cat"><a href="http://fr.groups.yahoo.com/group/parislinguists/members;_ylc=X3oDMTJmcWZmNzRlBF9TAzk3NDkwNDY4BGdycElkAzMxNDkxMjQEZ3Jwc3BJZAMyMTIzODEyNTI4BHNlYwN2dGwEc2xrA3ZtYnJzBHN0aW1lAzEzODY2MTUwNTA-?o=6" style="text-decoration: none;">Nouveaux membres</a></span>
<span class="ct" style="color: #ff7900;">6</span>
</li>
</ul>
<div style="clear: both; padding-top: 2px; color: #1e66ae;">
<a href="http://fr.groups.yahoo.com/group/parislinguists;_ylc=X3oDMTJlN2RnZDE0BF9TAzk3NDkwNDY4BGdycElkAzMxNDkxMjQEZ3Jwc3BJZAMyMTIzODEyNTI4BHNlYwN2dGwEc2xrA3ZnaHAEc3RpbWUDMTM4NjYxNTA1MA--" style="text-decoration: none;">Aller sur votre groupe</a>
</div>
</div>
<div id="ygrp-grfd" style="font-family: Verdana; font-size: 12px; padding: 15px 0;">
<!-- |**|begin egp html banner|**| -->
Pour se desinscire, envoyer un mel à parislinguists-unsubscribe@yahoogroups.com<BR>
Pour s'inscrire, envoyer un mel à parislinguists-subscribe@yahoogroups.com
<!-- |**|end egp html banner|**| -->
</div>
<div id="ft" style="font-family: Arial; font-size: 11px; margin-top: 5px; padding: 0 2px 0 0; clear: both;">
<a href="http://fr.groups.yahoo.com/;_ylc=X3oDMTJkNzQ0bnByBF9TAzk3NDkwNDY2BGdycElkAzMxNDkxMjQEZ3Jwc3BJZAMyMTIzODEyNTI4BHNlYwNmdHIEc2xrA2dmcARzdGltZQMxMzg2NjE1MDUw" style="float: left;"><img src="http://l.yimg.com/ru/static/images/yg/img/email/new_logo/yahoo_groups_fr-FR_145x19.png" height="19" width="145" alt="Yahoo! Groupes" style="border: 0;"/></a>
<div style="color: #747575; float: right;">Passer à : <a href="mailto:parislinguists-traditional@yahoogroupes.fr?subject=Changer le format : Traditionnel" style="text-decoration: none;">Texte seulement</a>, <a href="mailto:parislinguists-digest@yahoogroupes.fr?subject=Messages du groupe : Résumé" class="margin-rt" style="text-decoration: none;">Résumé du jour</a> • <a href="mailto:parislinguists-desabonnement@yahoogroupes.fr?subject=Désinscription" style="text-decoration: none;">Désinscription</a> • <a href="http://info.yahoo.com/legal/fr/yahoo/utos/terms/" style="text-decoration: none;">Conditions dutilisation</a></div>
</div>
<!-- |**|end egp html banner|**| -->
</div> <!-- ygrp-msg -->
<!-- Sponsor -->
<!-- |**|begin egp html banner|**| -->
<div id="ygrp-sponsor" style="width:160px; float:right; clear:none; margin:0 0 25px 0; background: #fff;">
<!-- Start Recommendations -->
<div id="ygrp-reco">
</div>
<!-- End Recommendations -->
</div> <!-- |**|end egp html banner|**| -->
<div style="clear:both; color: #FFF; font-size:1px;">.</div>
</div>
<img src="http://geo.yahoo.com/serv?s=97490468/grpId=3149124/grpspId=2123812528/msgId=5017/stime=1386615050" width="1" height="1"> <br>
<div style="color: #fff; height: 0;">__,_._,___</div>
<!--~-|**|PrettyHtmlEnd|**|-~-->
</body>
<!--~-|**|PrettyHtmlStart|**|-~-->
<head>
<style type="text/css">
<!--
#ygrp-mkp {
border: 1px solid #d8d8d8;
font-family: Arial;
margin: 10px 0;
padding: 0 10px;
}
#ygrp-mkp hr {
border: 1px solid #d8d8d8;
}
#ygrp-mkp #hd {
color: #628c2a;
font-size: 85%;
font-weight: 700;
line-height: 122%;
margin: 10px 0;
}
#ygrp-mkp #ads {
margin-bottom: 10px;
}
#ygrp-mkp .ad {
padding: 0 0;
}
#ygrp-mkp .ad p {
margin: 0;
}
#ygrp-mkp .ad a {
color: #0000ff;
text-decoration: none;
}
#ygrp-sponsor #ygrp-lc {
font-family: Arial;
}
#ygrp-sponsor #ygrp-lc #hd {
margin: 10px 0px;
font-weight: 700;
font-size: 78%;
line-height: 122%;
}
#ygrp-sponsor #ygrp-lc .ad {
margin-bottom: 10px;
padding: 0 0;
}
a {
color: #1e66ae;
}
#actions {
font-family: Verdana;
font-size: 11px;
padding: 10px 0;
}
#activity {
background-color: #e0ecee;
float: left;
font-family: Verdana;
font-size: 10px;
padding: 10px;
}
#activity span {
font-weight: 700;
}
#activity span:first-child {
text-transform: uppercase;
}
#activity span a {
color: #5085b6;
text-decoration: none;
}
#activity span span {
color: #ff7900;
}
#activity span .underline {
text-decoration: underline;
}
.attach {
clear: both;
display: table;
font-family: Arial;
font-size: 12px;
padding: 10px 0;
width: 400px;
}
.attach div a {
text-decoration: none;
}
.attach img {
border: none;
padding-right: 5px;
}
.attach label {
display: block;
margin-bottom: 5px;
}
.attach label a {
text-decoration: none;
}
blockquote {
margin: 0 0 0 4px;
}
.bold {
font-family: Arial;
font-size: 13px;
font-weight: 700;
}
.bold a {
text-decoration: none;
}
dd.last p a {
font-family: Verdana;
font-weight: 700;
}
dd.last p span {
margin-right: 10px;
font-family: Verdana;
font-weight: 700;
}
dd.last p span.yshortcuts {
margin-right: 0;
}
div.attach-table div div a {
text-decoration: none;
}
div.attach-table {
width: 400px;
}
div.file-title a, div.file-title a:active, div.file-title a:hover, div.file-title a:visited {
text-decoration: none;
}
div.photo-title a, div.photo-title a:active, div.photo-title a:hover, div.photo-title a:visited {
text-decoration: none;
}
div#ygrp-mlmsg #ygrp-msg p a span.yshortcuts {
font-family: Verdana;
font-size: 10px;
font-weight: normal;
}
.green {
color: #628c2a;
}
.MsoNormal {
margin: 0 0 0 0;
}
o {
font-size: 0;
}
#photos div {
float: left;
width: 72px;
}
#photos div div {
border: 1px solid #666666;
height: 62px;
overflow: hidden;
width: 62px;
}
#photos div label {
color: #666666;
font-size: 10px;
overflow: hidden;
text-align: center;
white-space: nowrap;
width: 64px;
}
#reco-category {
font-size: 77%;
}
#reco-desc {
font-size: 77%;
}
.replbq {
margin: 4px;
}
#ygrp-actbar div a:first-child {
/* border-right: 0px solid #000;*/
margin-right: 2px;
padding-right: 5px;
}
#ygrp-mlmsg {
font-size: 13px;
font-family: Arial, helvetica,clean, sans-serif;
*font-size: small;
*font: x-small;
}
#ygrp-mlmsg table {
font-size: inherit;
font: 100%;
}
#ygrp-mlmsg select, input, textarea {
font: 99% Arial, Helvetica, clean, sans-serif;
}
#ygrp-mlmsg pre, code {
font:115% monospace;
*font-size:100%;
}
#ygrp-mlmsg * {
line-height: 1.22em;
}
#ygrp-mlmsg #logo {
padding-bottom: 10px;
}
#ygrp-mlmsg a {
color: #1E66AE;
}
#ygrp-msg p a {
font-family: Verdana;
}
#ygrp-msg p#attach-count span {
color: #1E66AE;
font-weight: 700;
}
#ygrp-reco #reco-head {
color: #ff7900;
font-weight: 700;
}
#ygrp-reco {
margin-bottom: 20px;
padding: 0px;
}
#ygrp-sponsor #ov li a {
font-size: 130%;
text-decoration: none;
}
#ygrp-sponsor #ov li {
font-size: 77%;
list-style-type: square;
padding: 6px 0;
}
#ygrp-sponsor #ov ul {
margin: 0;
padding: 0 0 0 8px;
}
#ygrp-text {
font-family: Georgia;
}
#ygrp-text p {
margin: 0 0 1em 0;
}
#ygrp-text tt {
font-size: 120%;
}
#ygrp-vital ul li:last-child {
border-right: none !important;
}
-->
</style>
</head>
<!--~-|**|PrettyHtmlEnd|**|-~-->
</html>
<!-- end group email -->