<p class="" style="margin:5pt 0cm;text-align:justify"><b><span style="font-size:24pt">Atelier TALaRE 2013 : Traitement
Automatique des Langues Régionales de France et d’Europe</span></b><span class=""><b><span style></span></b></span></p>

<p class="" style="margin:5pt 0cm;text-align:justify"><span class=""><b><span style>Le 21 juin</span></b></span></p>

<p class="" style="margin:5pt 0cm;text-align:justify"><span class=""><b><span style>Atelier TALN 2013</span></b></span><span style>
20e conférence sur le Traitement Automatique des Langues Naturelles, Sables
d’Olonne, 17-21 juin 2013 </span></p>

<h1 style="text-align:justify">(See English Below)<br></h1><h1 style="text-align:justify"><span style="font-size:12pt;font-weight:normal"></span></h1><h1 style="text-align:justify"><span style="font-size:12pt;font-weight:normal">Les
recherches en traitement automatique des langues peu et moyennement dotées
connaissent actuellement un regain d’intérêt à travers la constitution de
corpus et de lexiques dans une perspective globale de préservation du
patrimoine culturel. Les langues régionales sont généralement à ranger dans cette
catégorie,<span style>  </span>car les ressources
électroniques pour ces langues sont rares, peu visibles et sous exploitées,
parfois inexistantes. Doter ces langues de ressources électroniques (notamment
de corpus écrits, de lexiques et de dictionnaires) est un enjeu considérable
pour leur diffusion, leur enseignement, leur sauvegarde, leur normalisation...
Il est, entre autres, nécessaire de développer des corpus écrits, les plus
représentatifs possibles des usages de la langue, en rassemblant des œuvres
écrites de différents genres (littérature, théâtre, poésie, conte, presse...)
et, pour certaines langues, en accueillant la variation (dialectale,
phonologique, graphique). La seconde étape consiste logiquement à enrichir ces
corpus d’annotations. L'élaboration des corpus annotés pour les langues
régionales soulève de nombreuses questions méthodologiques. Il n'est notamment
pas toujours possible de transposer directement les modèles existants pour les
langues très dotées, notamment en raison des variations dialectales et phonologiques
et du manque de standardisation graphique. Les corpus sont également une base
nécessaire pour l'élaboration des dictionnaires, lexiques et glossaires. Sur le
plan linguistique, les corpus sont nécessaires pour la description des usages
réels d'une langue. Et en contre-partie, sur le plan technique, les
dictionnaires et les lexiques sont nécessaires pour accompagner l’élaboration
des corpus (reconnaissance optique de caractères, lemmatisation et analyse
morpho-syntaxique). Lorsque ces ressources existent déjà pour une langue
(dictionnaires, lexiques, glossaires bilingues couplant une langue régionale et
une langue nationale), il se pose la question de la mutualisation des
informations contenues dans ces ressources, de l'enrichissement de ses données
avec des informations supplémentaires (phonétiques, morpho-syntaxiques,
syntaxiques…) et de leur utilisation dans des outils de TAL. Corpus et lexiques
sont enfin nécessaires pour le développement d'outils de traitement automatique
des langues (analyse morpho-syntaxique, syntaxique…).</span></h1>

<p class="" style="margin:5pt 0cm;text-align:justify"><span style>Au-delà
des difficultés techniques et méthodologiques, il ne faut pas négliger les
difficultés plus pragmatiques liées au manque de ressources financières et
humaines pour mener à bien la constitution de ressources. Cet atelier a pour
but de réunir des chercheurs qui participent à la constitution de ressources
linguistiques et d'outils "de base" du TAL pour les langues
régionales de France et d’Europe afin de partager nos questionnements et nos
méthodologies, de mutualiser nos réflexions et les techniques développées.</span></p>

<p class="" style="text-align:justify">Nous
appelons à la soumission de<span style> travaux de recherche autour de la
constitution de ressources et d'outils pour des langues régionales ou
minoritaires de France et d’Europe (y compris les langues d’Outre Mer), sur les
thématiques suivantes (sans s’y limiter):</span></p>

<p class="" style="margin-left:18pt;text-align:justify"><span style="font-family:Wingdings"><span style>v<span style="font:7pt "Times New Roman""> 
</span></span></span><span style>Ressources :</span></p>

<p class="" style="margin-left:43.2pt;text-align:justify"><span style="font-family:Symbol"><span style>·<span style="font:7pt "Times New Roman"">     
</span></span></span><span style>Constitution de corpus écrits</span></p>

<p class="" style="margin-left:43.2pt;text-align:justify"><span style="font-family:Symbol"><span style>·<span style="font:7pt "Times New Roman"">     
</span></span></span><span style>Elaboration de lexiques, dictionnaires,

<p class="" style="margin-left:18pt;text-align:justify"><span style="font-family:Wingdings"><span style>v<span style="font:7pt "Times New Roman""> 
</span></span></span><span style>Outils :</span></p>

<p class="" style="margin-left:36pt;text-align:justify"><span style="font-family:Symbol"><span style>·<span style="font:7pt "Times New Roman"">        
</span></span></span><span style>Outils pour la numérisation,
l’océrisation et le codage des textes</span></p>

<p class="" style="margin-left:36pt;text-align:justify"><span style="font-family:Symbol"><span style>·<span style="font:7pt "Times New Roman"">        
</span></span></span><span style>Annotations linguistiques (manuelle et
automatique pour analyses morpho-syntaxiques, syntaxiques…)</span></p>

<p class="" style="margin-left:36pt;text-align:justify"><span style="font-family:Symbol"><span style>·<span style="font:7pt "Times New Roman"">        
</span></span></span><span style>Interface et outils de recherche sur

<p class="" style="margin-left:18pt;text-align:justify"><span style="font-family:Wingdings"><span style>v<span style="font:7pt "Times New Roman""> 
</span></span></span><span style>Articulation entre théorie et pratique
autour des questions de la variation</span></p>

<p class="" style="margin:5pt 0cm;text-align:justify"><b style>CALENDRIER</b></p>

<p class="" style="margin:5pt 0cm 5pt 65.25pt;text-align:justify"><span style><span style>-<span style="font:7pt "Times New Roman"">                            
</span></span></span>Date limite de soumission : 29 mars 2013</p>

<p class="" style="margin:5pt 0cm 5pt 65.25pt;text-align:justify"><span style><span style>-<span style="font:7pt "Times New Roman"">                            
</span></span></span>Notification aux auteurs : 19 avril 2013</p>

<p class="" style="margin:5pt 0cm 5pt 65.25pt;text-align:justify"><span style><span style>-<span style="font:7pt "Times New Roman"">                            
</span></span></span>Date limite de soumission des versions
définitives : 3 mai 2013</p>

<p class="" style="margin:5pt 0cm;text-align:justify"><b style>SOUMISSION DES ARTICLES</b></p>

<p class="" style="margin:5pt 0cm;text-align:justify">Les articles
seront rédigés en français pour les francophones, en anglais pour ceux qui ne
maîtrisent pas le français.  Ils devront suivre le format de TALN 2013 et
comprendront 12 à 14 pages.  Une feuille de style LaTeX et un modèle Word
sont disponibles sur le site web de la conférence (<a href="http://www.taln2013.org/soumettre/">http://www.taln2013.org/soumettre/</a>).
 Les articles retenus donneront lieu à une présentation de 30 mn,
discussion comprise.</p>

<p class="" style="margin:5pt 0cm;text-align:justify">Les articles, au
format pdf, doivent être déposés à l’adresse <a href="https://www.easychair.org/conferences/?conf=talare2013">https://www.easychair.org/conferences/?conf=talare2013</a></p>

<p class="" style="margin:5pt 0cm;text-align:justify"><b style>CRITÈRES DE SÉLECTION</b></p>

<p class="" style="margin:5pt 0cm;text-align:justify">Les critères de
sélection sont les mêmes que ceux définis par TALN 2013 pour les articles de

<p class="" style="margin:5pt 0cm;text-align:justify"><b style>COMITE D’ORGANISATION</b></p>

<table class="" style="margin-left:0.75pt;border-collapse:collapse" border="0" cellpadding="0" cellspacing="0">
  <td style="width:120.05pt;padding:0.75pt" width="160">
  <p class="" style="text-align:justify">Marianne
  Vergez-Couret<span style></span></p>
  <td style="width:272.8pt;padding:0.75pt" width="364">
  <p class="" style="text-align:justify"><span style>CLLE-ERSS,
  Université de Toulouse 2</span></p>
  <td style="width:120.05pt;padding:0.75pt" width="160">
  <p class="" style="text-align:justify"><span style>Delphine
  <td style="width:272.8pt;padding:0.75pt" width="364">
  <p class="" style="text-align:justify"><span style>LILPA,
  Université de Strasbourg</span></p>
  <td style="width:120.05pt;padding:0.75pt" width="160">
  <p class="" style="text-align:justify">Jean-Michel
  Eloy<span style></span></p>
  <td style="width:272.8pt;padding:0.75pt" width="364">
  <p class="" style="text-align:justify"><span style>LESCLAP,
  Université de Picardie</span></p>
 <tr style>
  <td style="width:120.05pt;padding:0.75pt" width="160">
  <p class="" style="text-align:justify">Christophe
  Rey<span style></span></p>
  <td style="width:272.8pt;padding:0.75pt" width="364">
  <p class="" style="text-align:justify"><span style>LESCLAP,
  Université de Picardie</span></p>

<p class="" style="text-align:justify"><b><span style>COMITE
DE PROGRAMME (en cours de confirmation)</span></b></p>

<p class="" style><b style>Contact</b> : Marianne Vergez-Couret (<a href="mailto:vergez@univ-tlse2.fr">vergez@univ-tlse2.fr</a>)</p>

<p class="" style="margin:5pt 0cm;text-align:justify"><b><span style="font-size:24pt" lang="EN-US">Workshop TALaRE 2013: Natural Language Processing for French and
European Regional Languages</span></b><span class=""><b><span style lang="EN-US"></span></b></span></p>

<p class="" style="margin:5pt 0cm;text-align:justify"><span class=""><b><span style>June, 21st</span></b></span></p>

<p class="" style="margin:5pt 0cm;text-align:justify"><span class=""><b><span style>Held in conjunction with TALN 2013</span></b></span><span style>
20e conférence sur le Traitement Automatique des Langues Naturelles, Sables
d’Olonne, june, 17th-21st 2013 </span><span style></span></p>

<p class="" style><span style lang="EN">Research in natural language processing for under-resources languages is
currently an active area, in a global perspective of cultural heritage
preservation. Regional languages generally fall into this category, as
electronic resources for these languages are rare and sometimes non-existent.
Providing electronic resources for these languages (including written corpora,
lexicons and dictionaries) is a major asset for supporting their dissemination,
teaching, preservation or standardization. It is, among others, necessary to
develop written corpora, which are the most representative of language use, by
collecting written works of various genres (literature, theater, poetry,
storytelling, press ...) and, for some languages, by taking variation into
account (dialectal, phonological or graphical variations). The second step is
logically to enrich the corpora with annotations. The development of annotated
corpora for regional languages raises many methodological issues. It is not
always possible to directly transpose existing models for resource-rich
languages, partly because of dialectal and phonological variation and the lack
of writing standards. The corpora are also a basis for the development of
dictionaries, lexicons and glossaries and are necessary for the description of
the actual use of a language. On the other hand, dictionaries and lexicons are
needed to support the development of the corpora (optical character
recognition, lemmatization and morpho-syntactic analysis). When these resources
already exist for a language (dictionaries, lexicons, bilingual glossaries
coupling a regional and a national language), the question arises as to how
information contained in these resources can be shared and possibly be enriched
with additional annotations (phonetic, morphosyntactic, syntactic, ...).
Finally, corpora and lexicons are necessary for the development of natural
language processing tools (morpho-syntactic analysis or syntactic analyzers
...).</span><span class=""><span style lang="EN"></span></span></p>

<p class="" style="margin:5pt 0cm;text-align:justify"><span class=""><span style lang="EN">Beyond the</span></span><span style lang="EN"> <span class="">technical and methodological</span>
<span class="">challenges</span>, <span class="">the</span> <span class="">more
pragmatic</span> <span class="">difficulties</span> <span class="">related to
the lack of</span> <span class="">financial and human resources</span> <span class="">to carry out</span> <span class="">the creation of</span> <span class="">resources should not be neglected.</span> <span class="">This
workshop</span> <span class="">aims to</span> <span class="">bring together
researchers</span> <span class="">involved in</span> <span class="">the
creation of</span> <span class="">language resources and</span> <span class="">"basic"</span> <span class="">NLP</span> <span class="">tools</span>
<span class="">for</span> French and European <span class="">regional
languages, in order to share their</span> views, <span class="">methodologies
and techniques</span>.</span><span style lang="EN-US"></span></p>

<p class="" style="text-align:justify"><span style lang="EN-US">We invite submission of papers on
the constitution of resources and tools for regional or minority languages of
France and Europe (including languages from overseas departments and
territories of France).</span></p>

<p class="" style><span style lang="EN-US">Topics of interest include, but are not limited
to:</span><span style lang="EN-US"></span></p>

<p class="" style="margin-left:18pt;text-align:justify"><span style="font-family:Wingdings"><span style>v<span style="font:7pt "Times New Roman""> 
</span></span></span><span style>Resources:</span></p>

<p class="" style="margin-left:43.2pt;text-align:justify"><span style="font-family:Symbol"><span style>·<span style="font:7pt "Times New Roman"">     
</span></span></span><span style>Written corpus builing</span></p>

<p class="" style="margin-left:43.2pt;text-align:justify"><span style="font-family:Symbol"><span style>·<span style="font:7pt "Times New Roman"">     
</span></span></span><span style>Development of lexicons, dictionaries,

<p class="" style="margin-left:18pt;text-align:justify"><span style="font-family:Wingdings" lang="EN-US"><span style>v<span style="font:7pt "Times New Roman"">  </span></span></span><span style>Tools :</span><span style lang="EN-US"></span></p>

<p class="" style="margin-left:43.2pt;text-align:justify"><span class=""><span style="font-family:Symbol" lang="EN"><span style>·<span style="font:7pt "Times New Roman"">      </span></span></span></span><span style lang="EN-US">S</span><span class=""><span style lang="EN">canning, OCR</span></span><span style lang="EN"> <span class="">and</span> <span class="">text

<p class="" style="margin-left:43.2pt;text-align:justify"><span style="font-family:Symbol" lang="EN"><span style>·<span style="font:7pt "Times New Roman"">      </span></span></span><span class=""><span style lang="EN">Linguistic annotations</span></span><span style lang="EN"> <span class="">(manual and</span> <span class="">automatic for</span> <span class="">morpho-syntactic</span> or
syntactic <span class="">analysis</span>,<span class="">...)</span></span></p>

<p class="" style="margin-left:43.2pt;text-align:justify"><span style="font-family:Symbol" lang="EN-US"><span style>·<span style="font:7pt "Times New Roman"">      </span></span></span><span style lang="EN">Corpus management and query </span><span style lang="EN-US"></span></p>

<p class="" style="margin:5pt 0cm 5pt 18pt;text-align:justify"><span style="font-family:Wingdings" lang="EN-US"><span style>v<span style="font:7pt "Times New Roman"">  </span></span></span><span style lang="EN-US">Articulation between theory and
practice when dealing with variation</span><b style><span style lang="EN-US"></span></b></p>

<p class="" style="margin:5pt 0cm;text-align:justify"><b style><span style lang="EN-US">IMPORTANT DATES</span></b></p>

<p class="" style="margin:5pt 0cm 5pt 65.25pt;text-align:justify"><span style lang="EN-US"><span style>-<span style="font:7pt "Times New Roman"">                            
</span></span></span>Paper submission deadline: March 29, 2013<span style lang="EN-US"></span></p>

<p class="" style="margin:5pt 0cm 5pt 65.25pt;text-align:justify"><span style lang="EN-US"><span style>-<span style="font:7pt "Times New Roman"">                            
</span></span></span><span style lang="EN-US">Notification
of paper acceptance : April 19, 2013</span></p>

<p class="" style="margin:5pt 0cm 5pt 65.25pt;text-align:justify"><span style lang="EN-US"><span style>-<span style="font:7pt "Times New Roman"">                            
</span></span></span><span style lang="EN-US">Deadline
for camera-ready versions: May 3, 2013</span></p>

<p class="" style="margin:5pt 0cm;text-align:justify"><b style><span style lang="EN-US">PAPER SUBMISSION</span></b><span style lang="EN-US"></span></p>

<p class="" style="margin:5pt 0cm;text-align:justify"><span style lang="EN-US">Papers will be written in French for
French-speaking authors or English for non-French-speaking authors. They should
have from 12 to 14 pages in the TALN 2013 format.  A LaTeX style file and
a MS Word template are available on the conference website (</span><a href="http://www.taln2013.org/soumettre/"><span style lang="EN-US">http://www.taln2013.org/soumettre/</span></a><span style lang="EN-US">). Selected articles will be allocated 30
minutes for the oral presentation (including discussion).</span></p>

<p class="" style="margin:5pt 0cm;text-align:justify"><span style lang="EN-US">Authors should submit the papers in PDF through
the submission page at <br>
</span><a href="https://www.easychair.org/conferences/?conf=talare2013"><span style lang="EN-US">https://www.easychair.org/conferences/?conf=talare2013</span></a><b style><span style lang="EN-US"></span></b></p>

<p class="" style="margin:5pt 0cm;text-align:justify"><b style><span style lang="EN-US">SELECTION CRITERIA</span></b><span style lang="EN-US"></span></p>

<p class="" style="margin:5pt 0cm;text-align:justify"><span style lang="EN-US">The selection criteria will be the same as
those that apply for TALN 2013 research articles.</span></p>

<p class="" style="margin:5pt 0cm;text-align:justify"><b style>ORGANIZING COMMITTEE</b></p>

<table class="" style="margin-left:0.75pt;border-collapse:collapse" border="0" cellpadding="0" cellspacing="0">
  <td style="width:120.05pt;padding:0.75pt" width="160">
  <p class="" style="text-align:justify">Marianne
  Vergez-Couret<span style></span></p>
  <td style="width:272.8pt;padding:0.75pt" width="364">
  <p class="" style="text-align:justify"><span style>CLLE-ERSS,
  Université de Toulouse 2</span></p>
  <td style="width:120.05pt;padding:0.75pt" width="160">
  <p class="" style="text-align:justify"><span style>Delphine
  <td style="width:272.8pt;padding:0.75pt" width="364">
  <p class="" style="text-align:justify"><span style>LILPA,
  Université de Strasbourg</span></p>
  <td style="width:120.05pt;padding:0.75pt" width="160">
  <p class="" style="text-align:justify">Jean-Michel
  Eloy<span style></span></p>
  <td style="width:272.8pt;padding:0.75pt" width="364">
  <p class="" style="text-align:justify"><span style>LESCLAP,
  Université de Picardie</span></p>
 <tr style>
  <td style="width:120.05pt;padding:0.75pt" width="160">
  <p class="" style="text-align:justify">Christophe
  Rey<span style></span></p>
  <td style="width:272.8pt;padding:0.75pt" width="364">
  <p class="" style="text-align:justify"><span style>LESCLAP,
  Université de Picardie</span></p>

<p class="" style="text-align:justify"><b><span style>PROGRAM
COMMITTEE (in progress)</span></b></p>

<p class="" style><b style>Contact</b> : Marianne Vergez-Couret (<a href="mailto:vergez@univ-tlse2.fr">vergez@univ-tlse2.fr</a>)</p>
