<html xmlns:v="urn:schemas-microsoft-com:vml" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40"><head>
<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=iso-8859-1">
<meta name=Generator content="Microsoft Word 14 (filtered medium)"><base target="_blank"><style><!--
/* Font Definitions */
@font-face
        {font-family:Calibri;
        panose-1:2 15 5 2 2 2 4 3 2 4;}
@font-face
        {font-family:Consolas;
        panose-1:2 11 6 9 2 2 4 3 2 4;}
/* Style Definitions */
p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0cm;
        margin-bottom:.0001pt;
        font-size:11.0pt;
        font-family:"Calibri","sans-serif";
        mso-fareast-language:EN-US;}
a:link, span.MsoHyperlink
        {mso-style-priority:99;
        color:blue;
        text-decoration:underline;}
a:visited, span.MsoHyperlinkFollowed
        {mso-style-priority:99;
        color:purple;
        text-decoration:underline;}
p.MsoPlainText, li.MsoPlainText, div.MsoPlainText
        {mso-style-priority:99;
        mso-style-link:"Plain Text Char";
        margin:0cm;
        margin-bottom:.0001pt;
        font-size:11.0pt;
        font-family:"Calibri","sans-serif";
        mso-fareast-language:EN-US;}
p
        {mso-style-priority:99;
        margin:0cm;
        margin-bottom:.0001pt;
        font-size:12.0pt;
        font-family:"Times New Roman","serif";}
span.PlainTextChar
        {mso-style-name:"Plain Text Char";
        mso-style-priority:99;
        mso-style-link:"Plain Text";
        font-family:"Calibri","sans-serif";}
.MsoChpDefault
        {mso-style-type:export-only;
        font-family:"Calibri","sans-serif";
        mso-fareast-language:EN-US;}
@page WordSection1
        {size:612.0pt 792.0pt;
        margin:72.0pt 72.0pt 72.0pt 72.0pt;}
div.WordSection1
        {page:WordSection1;}
--></style><!--[if gte mso 9]><xml>
<o:shapedefaults v:ext="edit" spidmax="1026" />
</xml><![endif]--><!--[if gte mso 9]><xml>
<o:shapelayout v:ext="edit">
<o:idmap v:ext="edit" data="1" />
</o:shapelayout></xml><![endif]--></head><body lang=EN-GB link=blue vlink=purple><div class=WordSection1><p class=MsoPlainText>Hello John,<o:p></o:p></p><p class=MsoPlainText><o:p> </o:p></p><p class=MsoPlainText>Of course I agree with you. It would be great if these parallel corpora were available for further languages.<o:p></o:p></p><p class=MsoPlainText><o:p> </o:p></p><p class=MsoPlainText>UN corpora do exist for distribution elsewhere, but the EU corpora (which are the ones we at the JRC have access to) are by definition 'only' for the 24 official EU languages. <o:p></o:p></p><p class=MsoPlainText><o:p> </o:p></p><p class=MsoPlainText>Having said that, the translation memories ECDC-TM and EAC-TM (also available at <span class=MsoHyperlink><b><span style='color:#3399CC;mso-fareast-language:EN-GB'><a href="https://ec.europa.eu/jrc/en/language-technologies"><span style='color:#3399CC'>https://ec.europa.eu/jrc/en/language-technologies</span></a></span></b></span>) do include small numbers of non-EU languages. Furthermore, the resource <span class=MsoHyperlink><b><span style='color:#3399CC;mso-fareast-language:EN-GB'><a href="https://ec.europa.eu/jrc/en/language-technologies/jrc-names"><span style='color:#3399CC'>JRC-Names</span></a></span></b></span> includes details on many non-EU languages because it was produced by analysing news articles from around the world. <o:p></o:p></p><p class=MsoPlainText><o:p> </o:p></p><p class=MsoPlainText>For details on the choice of languages, on the differences between the available EU corpora, and on why we can distribute these parallel corpora and other highly multilingual language resources, etc., have a look at the brand-new overview paper:<o:p></o:p></p><p class=MsoPlainText><o:p> </o:p></p><p><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#000066'>     Steinberger Ralf, Mohamed Ebrahim, Alexandros Poulis, Manuel<o:p></o:p></span></p><p><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#000066'>     Carrasco-Benitez, Patrick Schlüter, Marek Przybyszewski & Signe Gilbro (August 2014). <br>     </span><span class=MsoHyperlink><b><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#3399CC'><a href="http://link.springer.com/article/10.1007/s10579-014-9277-0" target="_blank" title="LRE Journal article: An overview of the European Union's highly multilingual parallel corpora"><span style='color:#3399CC'>An overview of the European Union's highly multilingual parallel corpora</span></a></span></b></span><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#000066'>. <br>     Language Resources and Evaluation Journal (LRE). <br>     <o:p></o:p></span></p><p><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#000066'>     Springer link: </span><span class=MsoHyperlink><b><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#3399CC'>http://link.springer.com/article/10.1007/s10579-014-9277-0</span></b></span><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#000066'><br>     Manuscript: </span><span class=MsoHyperlink><b><span style='color:#3399CC'><a href="http://langtech.jrc.ec.europa.eu/Documents/2014_08_LRE-Journal_JRC-Linguistic-Resources_Manuscript.pdf"><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#3399CC'>http://langtech.jrc.ec.europa.eu/Documents/2014_08_LRE-Journal_JRC-Linguistic-Resources_Manuscript.pdf</span></a></span></b></span><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#000066'> <o:p></o:p></span></p><p class=MsoPlainText><o:p> </o:p></p><p class=MsoPlainText>All the best,<o:p></o:p></p><p class=MsoPlainText><o:p> </o:p></p><p class=MsoPlainText>Ralf <o:p></o:p></p><p class=MsoPlainText><o:p> </o:p></p><p class=MsoPlainText><o:p> </o:p></p><p class=MsoPlainText><span lang=EN-US style='mso-fareast-language:EN-GB'>-----Original Message-----<br>From: corpora-bounces@uib.no [mailto:corpora-bounces@uib.no] On Behalf Of John F Sowa<br>Sent: 18 September 2014 20:47<br>To: corpora@uib.no<br>Subject: Re: [Corpora-List] Release 2014 of DGT-TM (parallel corpus in 24 languages)</span></p><p class=MsoPlainText><o:p> </o:p></p><p class=MsoPlainText>On 9/18/2014 9:35 AM, Ralf Steinberger wrote:<o:p></o:p></p><p class=MsoPlainText>> Readers on this list may be interested to hear that the 2014 release <o:p></o:p></p><p class=MsoPlainText>> of the DGT-Translation Memory is now available for download.<o:p></o:p></p><p class=MsoPlainText><o:p> </o:p></p><p class=MsoPlainText>That is an excellent resource for the languages of the EU.  But it would be helpful to have at least a subset for languages outside the EU -- especially for the official languages of the UN that are not in the EU.<o:p></o:p></p><p class=MsoPlainText><o:p> </o:p></p><p class=MsoPlainText>Are such resources available?<o:p></o:p></p><p class=MsoPlainText><o:p> </o:p></p><p class=MsoPlainText>John<o:p></o:p></p><p class=MsoPlainText><o:p> </o:p></p><p class=MsoPlainText><o:p> </o:p></p><p class=MsoPlainText><o:p> </o:p></p><p class=MsoPlainText>_______________________________________________<o:p></o:p></p><p class=MsoPlainText>UNSUBSCRIBE from this page: <a href="http://mailman.uib.no/options/corpora"><span style='color:windowtext;text-decoration:none'>http://mailman.uib.no/options/corpora</span></a><o:p></o:p></p><p class=MsoPlainText>Corpora mailing list<o:p></o:p></p><p class=MsoPlainText><a href="mailto:Corpora@uib.no"><span style='color:windowtext;text-decoration:none'>Corpora@uib.no</span></a><o:p></o:p></p><p class=MsoPlainText><a href="http://mailman.uib.no/listinfo/corpora"><span style='color:windowtext;text-decoration:none'>http://mailman.uib.no/listinfo/corpora</span></a><o:p></o:p></p></div></body></html>