<div dir="ltr">The Software Localization English-Galician Parallel Corpus was compiled
during summer 2007 and was released under GPL in January 2008. It is
composed of Open Source (linux distributions and applications) software
localization translation units and it currently has 5,163,524
Part-of-Speech tagged and lemmatized tokens (2,535,405 Eglish tokens
and 2,628,119 Galician tokens). It can be found at: <a href="http://d108.dinaserver.com/hosting/paulomalvar.com/Paulo_Malvar_personal_webpage/Resources.html">http://d108.dinaserver.com/hosting/paulomalvar.com/Paulo_Malvar_personal_webpage/Resources.html</a><br>

<br>Best regards,<br><br>Paulo Malvar Fernández<br><br><br>-- <br>Paulo Malvar Fernández<br><br>M.A. in Computational Linguistics<br><br><a href="http://d108.dinaserver.com/hosting/paulomalvar.com">http://d108.dinaserver.com/hosting/paulomalvar.com</a><br>

</div>