<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=iso-8859-1">
<html xmlns:v="urn:schemas-microsoft-com:vml" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40">

<head>

<meta name=Generator content="Microsoft Word 12 (filtered medium)">
<style>
<!--
 /* Font Definitions */
 @font-face
        {font-family:SimSun;
        panose-1:2 1 6 0 3 1 1 1 1 1;}
@font-face
        {font-family:"Cambria Math";
        panose-1:2 4 5 3 5 4 6 3 2 4;}
@font-face
        {font-family:Calibri;
        panose-1:2 15 5 2 2 2 4 3 2 4;}
@font-face
        {font-family:"\@SimSun";
        panose-1:0 0 0 0 0 0 0 0 0 0;}
 /* Style Definitions */
 p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0cm;
        margin-bottom:.0001pt;
        font-size:12.0pt;
        font-family:"Times New Roman","serif";}
a:link, span.MsoHyperlink
        {mso-style-priority:99;
        color:blue;
        text-decoration:underline;}
a:visited, span.MsoHyperlinkFollowed
        {mso-style-priority:99;
        color:purple;
        text-decoration:underline;}
p
        {mso-style-priority:99;
        mso-margin-top-alt:auto;
        margin-right:0cm;
        mso-margin-bottom-alt:auto;
        margin-left:0cm;
        font-size:12.0pt;
        font-family:"Times New Roman","serif";}
span.EmailStyle18
        {mso-style-type:personal-reply;
        font-family:"Calibri","sans-serif";
        color:#1F497D;}
.MsoChpDefault
        {mso-style-type:export-only;
        font-size:10.0pt;}
@page Section1
        {size:612.0pt 792.0pt;
        margin:70.85pt 2.0cm 2.0cm 2.0cm;}
div.Section1
        {page:Section1;}
-->
</style>
<!--[if gte mso 9]><xml>
 <o:shapedefaults v:ext="edit" spidmax="1026" />
</xml><![endif]--><!--[if gte mso 9]><xml>
 <o:shapelayout v:ext="edit">
  <o:idmap v:ext="edit" data="1" />
 </o:shapelayout></xml><![endif]-->
</head>

<body lang=IT link=blue vlink=purple>

<div class=Section1>

<p class=MsoNormal><span lang=EN-US style='font-size:10.0pt;font-family:"Arial","sans-serif"'>[Apologize
for multiple postings]<o:p></o:p></span></p>

<p class=MsoNormal><span lang=EN-US style='font-size:10.0pt;font-family:"Arial","sans-serif"'><o:p> </o:p></span></p>

<p class=MsoNormal style='text-align:justify'><span lang=EN-US
style='font-size:10.0pt;font-family:"Arial","sans-serif"'>We are glad to announce
the final release of <b>CLIPS</b>, <b>corpus of spoken Italian</b>, freely
available at </span><span style='font-size:10.0pt;font-family:"Arial","sans-serif"'><a
href="http://www.clips.unina.it/"><span lang=EN-US>www.clips.unina.it</span></a></span><span
lang=EN-US style='font-size:10.0pt;font-family:"Arial","sans-serif"'>. The
corpus (audio files, annotation and documentation) are fully downloadable from the
website via ftp, free for research purposes. <o:p></o:p></span></p>

<p class=MsoNormal style='text-align:justify'><span lang=EN-US
style='font-size:10.0pt;font-family:"Arial","sans-serif"'><o:p> </o:p></span></p>

<p class=MsoNormal style='text-align:justify'><span lang=EN-US
style='font-size:10.0pt;font-family:"Arial","sans-serif"'>CLIPS consists of
about <b>100 hours of speech</b>, equally represented by female and male
voices. A section of the corpus is transcribed orthographically, a smaller
section has been phonetically labeled.  Recordings were made in 15 Italian
cities, selected on the basis of linguistic and socio-economic principles of
representativeness: </span><span lang=EN-US style='font-size:10.0pt;font-family:
"Arial","sans-serif"'>Bari, Bergamo, Bologna, Cagliari, Catanzaro, Firenze,
Genova, Lecce, Milano, Napoli, Palermo, Parma, Perugia, Roma, Venezia.<o:p></o:p></span></p>

<p class=MsoNormal style='text-align:justify'><span lang=EN-US
style='font-size:10.0pt;font-family:"Arial","sans-serif"'><o:p> </o:p></span></p>

<p class=MsoNormal style='text-align:justify'><span lang=EN-US
style='font-size:10.0pt;font-family:"Arial","sans-serif"'>For each of the <b>15
cities</b> different text typologies have been included: a) radio and
television broadcasts <span style='color:#002060'>(news, interviews, talk
shows); dialogue (240 dialogues collected using the map task procedure and the
“spot the difference” game. In this set: 30 dialogues are phonetically labeled,
90 orthographically transcribed); c) read speech from non professional speakers
(20 sentences each, covering medium-high frequency Italian words); d) speech
over the telephone (conversations between 300 speakers and a simulated hotel
desk service operator), e) read speech from 20 professional speakers (160
sentences, covering all phonotactic sequences and medium-high frequency Italian
words) recorded in an anechoic chamber.</span><o:p></o:p></span></p>

<p class=MsoNormal style='margin-right:42.55pt;text-align:justify;line-height:
150%'><span lang=EN-US style='font-size:10.0pt;line-height:150%;font-family:
"Arial","sans-serif"'>Documentation, corpus collection and annotation follow the
EAGLES guidelines.<o:p></o:p></span></p>

<p class=MsoNormal style='margin-right:42.55pt;text-align:justify;line-height:
150%'><span style='font-size:10.0pt;line-height:150%;font-family:"Arial","sans-serif"'>Sincerely,<o:p></o:p></span></p>

<p class=MsoNormal style='margin-right:42.55pt;text-align:justify;line-height:
150%'><span style='font-size:10.0pt;line-height:150%;font-family:"Arial","sans-serif"'>Federico
Albano Leoni (<a href="mailto:federico.albanoleoni@uniroma1.it">federico.albanoleoni@uniroma1.it</a>)<o:p></o:p></span></p>

<p class=MsoNormal style='margin-right:42.55pt;text-align:justify;line-height:
150%'><span style='font-size:10.0pt;line-height:150%;font-family:"Arial","sans-serif"'>Francesco
Cutugno (<a href="mailto:cutugno@unina.it">cutugno@unina.it</a>)<o:p></o:p></span></p>

<p class=MsoNormal style='margin-right:42.55pt;text-align:justify;line-height:
150%'><span style='font-size:10.0pt;line-height:150%;font-family:"Arial","sans-serif"'>Renata
Savy (<a href="mailto:rsavy@unisa.it">rsavy@unisa.it</a> )<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:10.0pt;font-family:"Arial","sans-serif"'>-------------------------------------------------------------------<o:p></o:p></span></p>

<p class=MsoNormal style='margin-right:42.55pt;text-align:justify;text-autospace:
none'><span style='font-size:10.0pt;font-family:"Arial","sans-serif"'>E’ in
rete il corpus di italiano parlato <b>CLIPS</b> al sito <a
href="http://www.clips.unina.it/">www.clips.unina.it</a>. Il corpus (audio,
etichettatura e documentazione) č pubblico, l’accesso e il download completo
del materiale per finalitā scientifiche sono gratuiti.<o:p></o:p></span></p>

<p class=MsoNormal style='margin-right:42.55pt;text-align:justify;text-autospace:
none'><span style='font-size:10.0pt;font-family:"Arial","sans-serif"'><o:p> </o:p></span></p>

<p class=MsoNormal style='margin-right:42.55pt;text-align:justify;text-autospace:
none'><i><span style='font-size:10.0pt;font-family:"Arial","sans-serif"'>CLIPS</span></i><span
style='font-size:10.0pt;font-family:"Arial","sans-serif"'> consiste di circa <b>100
ore</b> di parlato, equamente ripartito tra voci maschili e voci femminili, in
parte trascritto ortograficamente e etichettato foneticamente. Le registrazioni
sono state effettuate in <b>15 localitā</b> italiane scelte in base a criteri
di rappresentativitā linguistica e socioeconomica: Bari, Bergamo, Bologna,
Cagliari, Catanzaro, Firenze, Genova, Lecce, Milano, Napoli, Palermo, Parma,
Perugia, Roma, Venezia.<o:p></o:p></span></p>

<p class=MsoNormal style='margin-right:42.55pt;text-align:justify;text-autospace:
none'><span style='font-size:10.0pt;font-family:"Arial","sans-serif"'><o:p> </o:p></span></p>

<p class=MsoNormal style='margin-right:42.55pt;text-align:justify;text-autospace:
none'><span style='font-size:10.0pt;font-family:"Arial","sans-serif"'>Per <span
style='color:#002060'>ogni localitā č stato raccolto a) parlato radiotelevisivo
(notiziari, interviste, <i>talk shows</i>); b) parlato dialogico (240 dialoghi
raccolti secondo le modalitā del <i>map task </i>e del ‘gioco delle
differenze’, dei quali 30 etichettati foneticamente, 90 trascritti
ortograficamente, studenti universitari); c) parlato letto da parlanti non
professionisti (20 frasi atte a garantire la copertura delle frequenze
medio-alte del lessico italiano); d) parlato telefonico (conversazioni tra
circa 300 parlatori e un portiere d’albergo simulato) e) parlato letto da 20
parlanti professionisti (160 frasi atte a garantire la copertura delle sequenza
fonotattiche dell’italiano e delle frequenze medio-altedel lessico italiano)
registrato in camera anecoica.</span><o:p></o:p></span></p>

<p class=MsoNormal style='margin-right:42.55pt;text-align:justify'><span
style='font-size:10.0pt;font-family:"Arial","sans-serif"'>La documentazione, i
protocolli di raccolta e di annotazione del materiale tengono conto delle
direttive del progetto <i>EAGLES</i>. <o:p></o:p></span></p>

<p class=MsoNormal style='margin-right:42.55pt;text-align:justify;line-height:
150%'><span style='font-size:10.0pt;line-height:150%;font-family:"Arial","sans-serif"'>Federico
Albano Leoni (<a href="mailto:federico.albanoleoni@uniroma1.it">federico.albanoleoni@uniroma1.it</a>)<o:p></o:p></span></p>

<p class=MsoNormal style='margin-right:42.55pt;text-align:justify;line-height:
150%'><span style='font-size:10.0pt;line-height:150%;font-family:"Arial","sans-serif"'>Francesco
Cutugno (<a href="mailto:cutugno@unina.it">cutugno@unina.it</a>)<o:p></o:p></span></p>

<p class=MsoNormal style='margin-right:42.55pt;text-align:justify;line-height:
150%'><span style='font-size:10.0pt;line-height:150%;font-family:"Arial","sans-serif"'>Renata
Savy (<a href="mailto:rsavy@unisa.it">rsavy@unisa.it</a> )<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'><o:p> </o:p></span></p>

</div>

</body>

</html>