<div dir="ltr">Hi Stefan,<div>you can take a look at The Perugia Corpus (<a href="http://perugiacorpus.unistrapg.it/">http://perugiacorpus.unistrapg.it/</a>), a 26 million words reference corpus of Italian. There are three sections that may be of interest for media language: a tv section, a film section and a web section (with texts taken from chat and social networks interactions and blog posts).</div>
<div>Best regards,</div><div><br></div><div>Stefania Spina</div><div><br><div class="gmail_extra"><br><br><div class="gmail_quote"><br><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex">
<br>---------- Messaggio inoltrato ----------<br>From: Stefan Schneider <<a href="mailto:stefan.schneider@uni-graz.at">stefan.schneider@uni-graz.at</a>><br>To: "<a href="mailto:CORPORA@UIB.NO">CORPORA@UIB.NO</a>" <<a href="mailto:CORPORA@UIB.NO">CORPORA@UIB.NO</a>><br>
Cc: <br>Date: Fri, 22 Nov 2013 15:35:28 +0100<br>Subject: [Corpora-List] Italian media corpora<br>Dear colleagues,<br>
I am preparing a little survey of Italian media corpora. I am already aware of the following:<br>
- Corpora e lessici dell'italiano parlato e scritto (CLIPS)<br>
- Corpora LABLITA (Corpus di italiano parlato, corpus Stammerjohann, etc.)<br>
- Corpus di parlato cinematografico<br>
- Corpus di parlato telegiornalistico. Anni Sessanta vs. 2005 (CPT)<br>
- Integrated reference corpora for spoken romance languages (C-Oral-Rom)<br>
- Corpus del Lessico di frequenza dell'italiano parlato (LIP corpus)<br>
- Lessico italiano radiofonico (LIR corpus)<br>
- Lessico italiano televisivo (LIT corpus or LIT 2006 corpus)<br>
- Newsgroup UseNet Corpora (NUNC)<br>
- Corpus della Piattaforma per lapprendimento dellitaliano su corpora annotati (PAISĄ corpus)<br>
- SMS Monitor Studies<br>
- Corpus Stammerjohann<br>
- Corpus TWITA<br>
- Web as corpus kool ynitiative (corpus itWaC)<br>
All these corpora contain smaller or larger portions of media language (radio, television, telephone, etc.). I'd like to know whether there are other corpora documenting Italian media language, especially SMS, tweets and E-mails.<br>
Thank you<br>
Stefan Schneider (University of Graz)<br>
<br>
<br>
<br>
<br><br>
<br></blockquote></div><br><br clear="all"><div><br></div>-- <br><div dir="ltr">Stefania Spina<br>Universitą per Stranieri di Perugia<br>Dipartimento di Scienze Umane e Sociali<br><a href="mailto:stefania.spina@unistrapg.it" target="_blank">stefania.spina@unistrapg.it</a><br>
<a href="http://webclass.unistrapg.it/webclass/mod/data/view.php?d=1&rid=6" target="_blank">http://webclass.unistrapg.it/webclass/mod/data/view.php?d=1&rid=6</a><br>Twitter: @sspina</div>
</div></div></div>