<html xmlns:v="urn:schemas-microsoft-com:vml" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40"><head><META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=us-ascii"><meta name=Generator content="Microsoft Word 14 (filtered medium)"><style><!--
/* Font Definitions */
@font-face
        {font-family:Helvetica;
        panose-1:2 11 6 4 2 2 2 2 2 4;}
@font-face
        {font-family:Helvetica;
        panose-1:2 11 6 4 2 2 2 2 2 4;}
@font-face
        {font-family:Calibri;
        panose-1:2 15 5 2 2 2 4 3 2 4;}
@font-face
        {font-family:Tahoma;
        panose-1:2 11 6 4 3 5 4 4 2 4;}
/* Style Definitions */
p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0cm;
        margin-bottom:.0001pt;
        font-size:12.0pt;
        font-family:"Times New Roman","serif";}
a:link, span.MsoHyperlink
        {mso-style-priority:99;
        color:blue;
        text-decoration:underline;}
a:visited, span.MsoHyperlinkFollowed
        {mso-style-priority:99;
        color:purple;
        text-decoration:underline;}
span.EmailStyle17
        {mso-style-type:personal-reply;
        font-family:"Calibri","sans-serif";
        color:#1F497D;}
.MsoChpDefault
        {mso-style-type:export-only;
        font-family:"Calibri","sans-serif";
        mso-fareast-language:EN-US;}
@page WordSection1
        {size:612.0pt 792.0pt;
        margin:72.0pt 72.0pt 72.0pt 72.0pt;}
div.WordSection1
        {page:WordSection1;}
--></style><!--[if gte mso 9]><xml>
<o:shapedefaults v:ext="edit" spidmax="1026" />
</xml><![endif]--><!--[if gte mso 9]><xml>
<o:shapelayout v:ext="edit">
<o:idmap v:ext="edit" data="1" />
</o:shapelayout></xml><![endif]--></head><body lang=EN-GB link=blue vlink=purple><div class=WordSection1><p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D'>Dear Marina,<o:p></o:p></span></p><p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D'><o:p> </o:p></span></p><p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D'>At the JRC’s Language Technology page <a href="http://ipsc.jrc.ec.europa.eu/index.php?id=61">http://ipsc.jrc.ec.europa.eu/index.php?id=61</a>, you find parallel corpora for all the languages you are searching for, and more.<o:p></o:p></span></p><p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D'><o:p> </o:p></span></p><p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D'>All the best,<o:p></o:p></span></p><p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D'><o:p> </o:p></span></p><p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D'>Ralf<o:p></o:p></span></p><p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D'><o:p> </o:p></span></p><p class=MsoNormal><b><span lang=DE style='font-size:9.0pt;font-family:"Calibri","sans-serif";color:#4A442A'>Ralf Steinberger</span></b><span lang=DE style='font-size:9.0pt;font-family:"Calibri","sans-serif";color:#4A442A'> <o:p></o:p></span></p><p class=MsoNormal><span lang=EN-US style='font-size:9.0pt;font-family:"Calibri","sans-serif";color:#4A442A'>European Commission – Joint Research Centre (JRC)<o:p></o:p></span></p><p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D'><o:p> </o:p></span></p><p class=MsoNormal><b><span lang=EN-US style='font-size:10.0pt;font-family:"Tahoma","sans-serif"'>From:</span></b><span lang=EN-US style='font-size:10.0pt;font-family:"Tahoma","sans-serif"'> corpora-bounces@uib.no [mailto:corpora-bounces@uib.no] <b>On Behalf Of </b>Marina Santini<br><b>Sent:</b> 23 March 2014 15:26<br><b>To:</b> corpora@uib.no; Marina Santini<br><b>Subject:</b> [Corpora-List] Looking for Corpora in: English, Swedish, Polish, Italian, Finnish, Estonian, Hungarian<o:p></o:p></span></p><p class=MsoNormal><o:p> </o:p></p><div><p class=MsoNormal><span style='font-size:10.0pt;font-family:"Helvetica","sans-serif";color:#333333'>Hi, </span><o:p></o:p></p><div><p class=MsoNormal><span style='font-size:10.0pt;font-family:"Helvetica","sans-serif";color:#333333'><br>I am looking for corpora of any genre in the following languages: English, Swedish, Polish, Italian, Finnish, Estonian, and Hungarian. <br>I am already aware of a number of corpora (several posts in the WebGenre blog are dedicated to the dissemination of corpora-related information). These corpora, though, are mostly in English. I would like now to focus on: 1) additional languages and 2) additional genres, such as search query logs, tv scripts, emails, tweets, whatsup messages, etc. <br>All genres are well accepted! The only requirement is: corpora must be free and publicly available. Everybody must be able to replicate or extend experiments using the same corpora/datasets. <br><br>The purpose of the experiments is to explore cross-linguality in different settings. Please, read the use cases in the blog post to have an idea of the type of communicative situations under investigation (</span><a href="http://www.forum.santini.se/2014/03/looking-for-corpora-to-explore-cross-linguality/">http://www.forum.santini.se/2014/03/looking-for-corpora-to-explore-cross-linguality/</a><span style='font-size:10.0pt;font-family:"Helvetica","sans-serif";color:#333333'>)</span><o:p></o:p></p></div><div><p class=MsoNormal><span style='font-size:10.0pt;font-family:"Helvetica","sans-serif";color:#333333'><br>Thanx in advance for your suggestions and pointers. </span><o:p></o:p></p><div><div><p class=MsoNormal>-- <o:p></o:p></p></div><p class=MsoNormal>Marina Santini<o:p></o:p></p></div><div><p class=MsoNormal><a href="http://www.forum.santini.se">http://www.forum.santini.se</a> <br><a href="http://www.linkedin.com/groups/WebGenre-R-D-Group-4301498" target="_blank"><span style='font-size:10.0pt;font-family:"Arial","sans-serif"'>http://www.linkedin.com/groups/WebGenre-R-D-Group-4301498</span></a><o:p></o:p></p></div></div></div></div></body></html>