<html><head></head><body style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space; "><div><span class="Apple-style-span" style="white-space: pre; "><small><font class="Apple-style-span" size="3"><span class="Apple-style-span" style="font-size: 12px;"><b><font class="Apple-style-span" color="#0741DB">Objet du message</font></b><font class="Apple-style-span" color="#0741DB"><b> = Appel à collaboration : lemmatisation du français 15è-20è s.</b></font></span></font></small></span></div><div><span class="Apple-style-span" style="white-space: pre; "><small><font class="Apple-style-span" size="3"><span class="Apple-style-span" style="font-size: 12px;"><b><font class="Apple-style-span" color="#0741DB">Coordonnées</font></b><font class="Apple-style-span" color="#0741DB">: VIGIER, Denis, MCF Lyon2, UMR ICAR <a href="http://icar.univ-lyon2.fr/membres/dvigier/">http://icar.univ-lyon2.fr/membres/dvigier/</a></font></span></font></small></span></div><div><font class="Apple-style-span" color="#0741DB"><br></font></div><div><font class="Apple-style-span" color="#0741DB">Chères et chers collègues,</font></div><div><font class="Apple-style-span" color="#0741DB"><br></font></div><div><font class="Apple-style-span" color="#0741DB">Vous serait-il possible de diffuser à votre liste de destinataires l'annonce ci-dessous (Appel à collaboration : lemmatisation du français 15è-20è s.) pour le projet PRESTO (ANR-DFG 2013-2016)</font></div><div><font class="Apple-style-span" color="#0741DB">D'avance merci</font></div><div><font class="Apple-style-span" color="#0741DB">Bien cordialement</font></div><div><font class="Apple-style-span" color="#0741DB"><br></font></div><div><font class="Apple-style-span" color="#0741DB">Denis Vigier</font></div><div><font class="Apple-style-span" color="#0741DB">MCF Langue et Linguistique Françaises</font></div><div><font class="Apple-style-span" color="#0741DB">Université Lyon 2 / UMR ICAR</font></div><div><span class="Apple-style-span" style="font-size: 12px; white-space: pre; "><font class="Apple-style-span" color="#0741DB"><a href="http://icar.univ-lyon2.fr/membres/dvigier">http://icar.univ-lyon2.fr/membres/dvigier</a></font></span></div><div><span class="Apple-style-span" style="color: rgb(0, 1, 15); "><br></span></div><div><span class="Apple-style-span" style="color: rgb(0, 1, 15); ">---------------------------------</span></div><div><span class="Apple-style-span" style="color: rgb(0, 1, 15); "><br></span></div><div><span class="Apple-style-span" style="color: rgb(0, 1, 15); "><br></span></div><div><span class="Apple-style-span" style="color: rgb(0, 1, 15); ">Chers collègues,</span></div><div><div><div><font class="Apple-style-span" color="#00010F"><br>Le projet PRESTO financé par l'ANR et la DFG (resp.: D. Vigier, Univ. Lyon2 et P. Blumenthal, Univ. de Cologne - CF Résumé ci-dessous) lance une opération de lemmatisation d'un corpus de textes français dont les dates de composition s'échelonnent de 1500 et 2000. Pour cela, il a été prévu :</font></div><font class="Apple-style-span" color="#00010F">- de construire un ou plusieurs lemmatiseurs sur la base des logiciels de l'état de l'art (MElt, TreeTagger, LGTagger...) ;<br>- de construire un lexique morphologique le plus complet possible associant « forme(1) - catégorie morphosyntaxique(2) - lemme(3) » ;<br>- de construire des jeux de règles de transformation orthographique (modernisation ou archaïsation) ;<br></font><div><font class="Apple-style-span" color="#00010F">- de construire des corpus d'apprentissage déjà étiquetés. </font></div><div><font class="Apple-style-span" color="#00010F"><br>Le projet PRESTO souhaite développer le lexique en appliquant un modèle de construction équivalent à celui utilisé pour le développement des logiciels ouverts (open-source), c'est à dire en compilant différents lexiques en un lexique commun diffusé sous licence libre - de type LGPLFLR (Lesser General Public License For Linguistic Resources - voir : </font><a href="http://hoop.univ-mlv.fr/lgpllr.html"><font class="Apple-style-span" color="#00010F">http://hoop.univ-mlv.fr/lgpllr.html</font></a><font class="Apple-style-span" color="#00010F">). Cette licence précisera explicitement la contribution de chaque partenaire et la mise à jour régulière du lexique sera réalisée de façon communautaire au bénéfice de tous les contributeurs.<br><br>Le développement du lemmatiseur se fera dans le cadre de la plateforme TXM qui offre déjà un cadre de développement open-source en logistique de corpus (gestion de formats standards en import et en export,<br>intégration d'outils de TAL tiers, etc.). Ce nouvel outil de lemmatisation sera ouvert à tous et librement adaptable (open-source avec une licence de diffusion de logiciel de type GNU GPL - voir : </font><a href="http://www.rodage.org/gpl-3.0.fr.txt"><font class="Apple-style-span" color="#00010F">http://www.rodage.org/gpl-3.0.fr.txt</font></a><font class="Apple-style-span" color="#00010F">).<br><br>Si vous disposez de ressources pour la période 15è - 20è s., nous souhaiterions savoir si vous êtes intéressés par des échanges et par le partage d'un lexique, de jeux de règles de transformation ou de corpus d'apprentissage dans les conditions décrites ci-dessus.</font></div><div><font class="Apple-style-span" color="#00010F"><br>Si vous connaissez des personnes qui pourraient être intéressées, nous vous serions très reconnaissants de leur faire suivre ce mail.<br><br>Bien cordialement,</font></div><div><font class="Apple-style-span" color="#00010F"><br>Denis Vigier et Peter Blumenthal pour le projet PRESTO</font></div><div><font class="Apple-style-span" color="#00010F"><span class="Apple-style-span" style="color: rgb(255, 44, 79); ">Adresse de contact:</span></font></div><div><font class="Apple-style-span" color="#00010F"><br></font></div><div><font class="Apple-style-span" color="#00010F">(1) certaines formes pourront être composées si nécessaire (par exemple comme dans le cas d'un dictionnaire Unitex)<br>(2) nous souhaiterions utiliser un jeu d'étiquettes normalisé basé par exemple sur le standard Multext </font><span style="font-size: 10pt; font-family: Helvetica; "><font class="Apple-style-span" color="#00010F">adapté aux différents états de langue diachroniques</font></span><font class="Apple-style-span" color="#00010F"> (</font><a href="http://nl.ijs.si/ME/V4"><font class="Apple-style-span" color="#00010F">http://nl.ijs.si/ME/V4</font></a><font class="Apple-style-span" color="#00010F">)<br>(3) nous souhaiterions utiliser des formes modernisées des lemmes </font><span class="Apple-style-span" style="font-size: 13px; "><font class="Apple-style-span" color="#00010F">y compris pour les périodes anciennes</font></span></div><div><font class="Apple-style-span" color="#00010F"><br></font></div><div><font class="Apple-style-span" color="#00010F"><br></font></div><div><u><font class="Apple-style-span" color="#00010F">Résumé du projet PRESTO:</font></u></div><div><p class="MsoNormal" style="text-align: justify; text-indent: 17.85pt; "><i><font class="Apple-style-span" color="#00010F">Ce projet a pour but l’étude diachronique de l’emploi, des valeurs sémantiques et discursives des prépositions françaises "à, en, par, contre, dès, devant, entre, pour, sans, sur, sous, vers, dans", de l’ancienne langue jusqu’au français contemporain.</font></i></p><p class="MsoNormal" style="text-align: justify; text-indent: 17.85pt; "><i><font class="Apple-style-span" color="#00010F">Instrumentée, adossée à une approche statistique et distributionnelle, cette étude portera sur les variations du comportement combinatoire des prépositions suivant des critères de dates (évolution diachronique), de genres et d’auteurs. Notre attention se portera tout particulièrement sur la détection des combinaisons hautement spécifiques </font></i><i><font class="Apple-style-span" color="#00010F">dans lesquelles entrent ces prépositions. Nous étudierons l’émergence, la réorganisation et le déclin de structures prépositionnelles figées. Nous comptons parvenir à une vision innovatrice du devenir historique sur la base d’un modèle d’analyse fondé sur deux séries de démarches méthodologiques : (1) l’étude de l’interdépendance entre le quantitatif (les emplois) et le qualitatif (les valeurs) ; (2) l’étude des principes qui ont guidé, en diachronie, la recherche de plus-values sémantiques et discursives, véritable moteur du changement linguistique.</font></i></p><p class="MsoNormal" style="text-align: justify; text-indent: 17.85pt; "><i><font class="Apple-style-span" color="#00010F"><o:p></o:p></font></i></p><i><font class="Apple-style-span" color="#00010F">L’un des réquisits – mais aussi l’un des apports majeurs de ce projet - consistera en la constitution d’un corpus comportant des données étiquetées et lemmatisées, représentant toutes les périodes de l’histoire du français ainsi que différents genres discursifs et types de textes. Ce corpus, élaboré conjointement par les équipes française et allemande, s’appuiera pour partie sur les ressources déjà disponibles à Lyon (période médiévale), à Tours (XVI</font></i><sup><font class="Apple-style-span" size="3"><span class="Apple-style-span" style="font-size: 12px; "><i><font class="Apple-style-span" color="#00010F">e</font></i></span></font></sup><i><font class="Apple-style-span" color="#00010F"> s.), à Nancy (ATILF) et à Cologne (période moderne, XVII</font></i><sup><font class="Apple-style-span" size="3"><span class="Apple-style-span" style="font-size: 12px; "><i><font class="Apple-style-span" color="#00010F">e</font></i></span></font></sup><i><font class="Apple-style-span" color="#00010F"> s. – XX</font></i><sup><font class="Apple-style-span" size="3"><span class="Apple-style-span" style="font-size: 12px; "><i><font class="Apple-style-span" color="#00010F">e</font></i></span></font></sup><i><font class="Apple-style-span" color="#00010F"> s.). Une politique active sera menée pour permettre l’ouverture de la plus grande partie possible de ce corpus.</font></i></div></div></div><div><i><font class="Apple-style-span" color="#00010F"><br></font></i></div></body></html>