[Corpora-List] Italian media corpora

Stefan Schneider stefan.schneider at uni-graz.at
Fri Nov 22 14:35:28 UTC 2013


Dear colleagues,
I am preparing a little survey of Italian media corpora. I am already 
aware of the following:
- Corpora e lessici dell'italiano parlato e scritto (CLIPS)
- Corpora LABLITA (Corpus di italiano parlato, corpus Stammerjohann, etc.)
- Corpus di parlato cinematografico
- Corpus di parlato telegiornalistico. Anni Sessanta vs. 2005 (CPT)
- Integrated reference corpora for spoken romance languages (C-Oral-Rom)
- Corpus del Lessico di frequenza dell'italiano parlato (LIP corpus)
- Lessico italiano radiofonico (LIR corpus)
- Lessico italiano televisivo (LIT corpus or LIT 2006 corpus)
- Newsgroup UseNet Corpora (NUNC)
- Corpus della Piattaforma per l’apprendimento dell’italiano su corpora 
annotati (PAISÀ corpus)
- SMS Monitor Studies
- Corpus Stammerjohann
- Corpus TWITA
- Web as corpus kool ynitiative (corpus itWaC)
All these corpora contain smaller or larger portions of media language 
(radio, television, telephone, etc.). I'd like to know whether there are 
other corpora documenting Italian media language, especially SMS, tweets 
and E-mails.
Thank you
Stefan Schneider (University of Graz)


_______________________________________________
UNSUBSCRIBE from this page: http://mailman.uib.no/options/corpora
Corpora mailing list
Corpora at uib.no
http://mailman.uib.no/listinfo/corpora



More information about the Corpora mailing list