<div dir="ltr">The Software Localization English-Galician Parallel Corpus was compiled during summer 2007 and was released under GPL in January 2008. It is composed of Open Source (linux distributions and applications) software localization translation units and it currently has 5,163,524 Part-of-Speech tagged and lemmatized tokens (2,535,405 Eglish tokens and 2,628,119 Galician tokens). It can be found at: <a href="http://paulomalvar.dyndns.org:8080/Paulo_Malvar_personal_webpage/Resources.html">http://paulomalvar.dyndns.org:8080/Paulo_Malvar_personal_webpage/Resources.html</a><br>
<br><br>Best regards,<br><br>Paulo Malvar Fernández<br clear="all"><br>-- <br>Paulo Malvar Fernández<br><br>Research Assistant of the SDSU Computational Linguistics Lab<br><br><a href="http://paulomalvar.homeunix.org">http://paulomalvar.homeunix.org</a>
</div>