<html xmlns:v="urn:schemas-microsoft-com:vml" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40"><head><meta http-equiv=Content-Type content="text/html; charset=utf-8"><meta name=Generator content="Microsoft Word 14 (filtered medium)"><base target="_blank"><style><!--
/* Font Definitions */
@font-face
        {font-family:SimSun;
        panose-1:2 1 6 0 3 1 1 1 1 1;}
@font-face
        {font-family:SimSun;
        panose-1:2 1 6 0 3 1 1 1 1 1;}
@font-face
        {font-family:Calibri;
        panose-1:2 15 5 2 2 2 4 3 2 4;}
@font-face
        {font-family:"\@SimSun";
        panose-1:2 1 6 0 3 1 1 1 1 1;}
/* Style Definitions */
p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0cm;
        margin-bottom:.0001pt;
        font-size:11.0pt;
        font-family:"Calibri","sans-serif";}
a:link, span.MsoHyperlink
        {mso-style-priority:99;
        color:blue;
        text-decoration:underline;}
a:visited, span.MsoHyperlinkFollowed
        {mso-style-priority:99;
        color:purple;
        text-decoration:underline;}
span.EmailStyle17
        {mso-style-type:personal-compose;
        font-family:"Calibri","sans-serif";
        color:windowtext;}
.MsoChpDefault
        {mso-style-type:export-only;
        font-family:"Calibri","sans-serif";
        mso-fareast-language:EN-US;}
@page WordSection1
        {size:612.0pt 792.0pt;
        margin:72.0pt 72.0pt 72.0pt 72.0pt;}
div.WordSection1
        {page:WordSection1;}
--></style><!--[if gte mso 9]><xml>
<o:shapedefaults v:ext="edit" spidmax="1026" />
</xml><![endif]--><!--[if gte mso 9]><xml>
<o:shapelayout v:ext="edit">
<o:idmap v:ext="edit" data="1" />
</o:shapelayout></xml><![endif]--></head><body lang=EN-GB link=blue vlink=purple><div class=WordSection1><p class=MsoNormal><span style='color:#002060'>EAC-TM is a translation memory (sentences and their manually produced translations) in 26 languages. It is a multilingual parallel corpus covering 325 language pairs.<o:p></o:p></span></p><p class=MsoNormal><span style='color:#002060'><o:p> </o:p></span></p><p class=MsoNormal><b><span style='font-size:10.0pt;font-family:"Courier New";color:#632523'>Size:       Up to 5100 translation units per language</span></b><span style='font-size:10.0pt;font-family:"Courier New";color:#632523'>; 78,000 in total.<o:p></o:p></span></p><p class=MsoNormal><b><span style='font-size:10.0pt;font-family:"Courier New";color:#632523'><o:p> </o:p></span></b></p><p class=MsoNormal><b><span style='font-size:10.0pt;font-family:"Courier New";color:#632523'>Languages:  </span></b><span style='font-size:10.0pt;font-family:"Courier New";color:#632523'>All 325 language pairs involving the following 26 languages: <o:p></o:p></span></p><p class=MsoNormal><span style='font-size:10.0pt;font-family:"Courier New";color:#632523'><o:p> </o:p></span></p><p class=MsoNormal><span style='font-size:10.0pt;font-family:"Courier New";color:#632523'>            Bulgarian, Czech, Danish, Dutch, English, Estonian, German, <o:p></o:p></span></p><p class=MsoNormal style='margin-left:36.0pt;text-indent:36.0pt'><span style='font-size:10.0pt;font-family:"Courier New";color:#632523'>Greek, Finnish, French, Croatian, Hungarian, Icelandic, Italian, <o:p></o:p></span></p><p class=MsoNormal style='margin-left:36.0pt;text-indent:36.0pt'><span style='font-size:10.0pt;font-family:"Courier New";color:#632523'>Latvian, Lithuanian, Maltese, Norwegian, Polish, Portuguese, <o:p></o:p></span></p><p class=MsoNormal style='margin-left:36.0pt;text-indent:36.0pt'><span style='font-size:10.0pt;font-family:"Courier New";color:#632523'>Romanian, Slovak, Slovene, Spanish, Swedish and Turkish.<o:p></o:p></span></p><p class=MsoNormal><span style='font-size:10.0pt;font-family:"Courier New";color:#632523'>            <o:p></o:p></span></p><p class=MsoNormal><b><span style='font-size:10.0pt;font-family:"Courier New";color:#632523'>URL:        </span></b><span style='font-size:10.0pt;font-family:"Courier New"'><a href="http://langtech.jrc.ec.europa.eu/EAC-TM.html">http://langtech.jrc.ec.europa.eu/EAC-TM.html</a>  <o:p></o:p></span></p><p class=MsoNormal><b><span style='font-size:10.0pt;font-family:"Courier New";color:#632523'>Creator:    </span></b><span style='font-size:10.0pt;font-family:"Courier New";color:#632523'><a href="http://ec.europa.eu/dgs/education_culture/">EC Directorate for Education and Culture</a> (<a href="http://ec.europa.eu/dgs/education_culture/" target="_blank">EAC</a>) and JRC<o:p></o:p></span></p><p class=MsoNormal><span style='color:#002060'><o:p> </o:p></span></p><p class=MsoNormal><span style='color:#002060'><o:p> </o:p></span></p><p class=MsoNormal><u><span style='color:#002060'>WHAT IS EAC-TM<o:p></o:p></span></u></p><p class=MsoNormal><span style='color:#002060'><o:p> </o:p></span></p><p class=MsoNormal><span style='color:#002060'>EAC-TM was produced by translating the English language form data for the EAC’s <i>Lifelong Learning Programme</i> (LLP) and the <i>Youth in Action Programme</i> of the European Commission’s <i>Directorate General for Education and Culture</i> (EAC). The results of the translation were stored in 25 bilingual translation memories. DG EAC and the JRC post-processed these by cleaning the data and by producing one alignment for all 26 languages, resulting in parallel data for 325 language pairs.<o:p></o:p></span></p><p class=MsoNormal><span style='color:#002060'><o:p> </o:p></span></p><p class=MsoNormal><span style='color:#002060'>The underlying documents are thus form data in the field of education and culture.<o:p></o:p></span></p><p class=MsoNormal><span style='color:#002060'><o:p> </o:p></span></p><p class=MsoNormal><span style='color:#002060'>The <a href="http://langtech.jrc.ec.europa.eu/EAC-TM.html">EAC Translation Memory</a> is much smaller than the other multilingual resources distributed in the past by the European Commission’s <i>Joint Research Centre</i> (JRC). Its main advantages are that (a) it covers even more languages and (b) it is based on texts from a very different domain (education and culture).<o:p></o:p></span></p><p class=MsoNormal><span style='color:#002060'><o:p> </o:p></span></p><p class=MsoNormal><span style='color:#002060'><o:p> </o:p></span></p><p class=MsoNormal><u><span style='color:#002060'>MOTIVATION FOR THIS RELEASE<o:p></o:p></span></u></p><p class=MsoNormal><span style='color:#002060'><o:p> </o:p></span></p><p class=MsoNormal><span style='color:#002060'>The public data release is in line with the general effort of the European Commission to support multilingualism, language diversity and the re-use of Commission information. It follows the release of the <a href="http://langtech.jrc.ec.europa.eu/JRC-Acquis.html">JRC-Acquis</a> parallel corpus in 2006 (over 1 billion words in 22 languages), of the <a href="http://langtech.jrc.ec.europa.eu/DGT-TM.html">DGT-TM Translation Memory</a> in 2007 and 2011, the multilingual named entity resource <a href="http://langtech.jrc.ec.europa.eu/JRC-Names.html">JRC-Names</a> in 2011, the multi-label classification software <a href="http://langtech.jrc.ec.europa.eu/Eurovoc.html">JRC EuroVoc Indexer JEX</a> in 22 languages in 2012,the <a href="http://ipsc.jrc.ec.europa.eu/?id=782">ECDC-TM Translation Memory</a> in 25 languages in 2012, the <a href="http://ipsc.jrc.ec.europa.eu/?id=783">DGT-Acquis</a> parallel corpus in 23 languages in 2012, and further smaller multilingual resources. See <a href="http://ipsc.jrc.ec.europa.eu/?id=61">http://ipsc.jrc.ec.europa.eu/?id=61</a> for more information on these resources.<o:p></o:p></span></p><p class=MsoNormal><span style='color:#002060'><o:p> </o:p></span></p><p class=MsoNormal><span style='color:#002060'><o:p> </o:p></span></p><p class=MsoNormal><u><span style='color:#002060'>WHAT EAC-TM CAN BE USED FOR<o:p></o:p></span></u></p><p class=MsoNormal><span style='color:#002060'>                <o:p></o:p></span></p><p class=MsoNormal><span style='color:#002060'>EAC-TM can be fed into translation memory software to support human translators in their work. As it is a large parallel corpus in electronic form, it can furthermore be used by specialists in computational linguistics to train statistical machine translation software, to generate multilingual dictionaries, to train and test multilingual information extraction software, and more.<o:p></o:p></span></p><p class=MsoNormal><span style='color:#002060'><o:p> </o:p></span></p><p class=MsoNormal><span style='color:#002060'><o:p> </o:p></span></p><p class=MsoNormal><u><span style='color:#002060'>WHAT NEXT?<o:p></o:p></span></u></p><p class=MsoNormal><span style='color:#002060'><o:p> </o:p></span></p><p class=MsoNormal><span style='color:#002060'>The JRC and collaborating services of the European Commission hope to release further large-scale linguistic resources in the future.<o:p></o:p></span></p><p class=MsoNormal><span style='color:#002060'><o:p> </o:p></span></p><p class=MsoNormal><span style='color:#002060'><o:p> </o:p></span></p><p class=MsoNormal><span class=MsoHyperlink><b><span style='color:gray'><a href="http://langtech.jrc.ec.europa.eu/RS.html"><span style='font-size:9.0pt;color:gray'>Ralf Steinberger</span></a></span></b></span><b><span style='font-size:9.0pt;color:gray'> & Mohamed Ebrahim</span></b><span style='font-size:9.0pt;color:gray'><br>European Commission - Joint Research Centre (JRC)<br>21027 Ispra (VA), Italy<o:p></o:p></span></p><p class=MsoNormal><span style='font-size:9.0pt;color:gray'>URL – Applications: <a href="http://emm.newsbrief.eu/overview.html"><span style='color:gray'>http://emm.newsbrief.eu/overview.html</span></a> <o:p></o:p></span></p><p class=MsoNormal><span style='font-size:9.0pt;color:gray'>URL – Publications on the science behind them: <span class=MsoHyperlink><span style='color:gray'><a href="http://langtech.jrc.ec.europa.eu/JRC_Publications.html"><span style='color:gray'>http://langtech.jrc.ec.europa.eu/JRC_Publications.html</span></a> </span></span></span><span class=MsoHyperlink><span style='color:gray'><o:p></o:p></span></span></p><p class=MsoNormal><o:p> </o:p></p></div></body></html>