<html><head><meta http-equiv="Content-Type" content="text/html charset=windows-1252"></head><body style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space;">Hello Saeed,<div><br></div><div>I think you can also use a tool called XenC I developed and released last year.</div><div>I believe it can help you since it was designed to cope with similar needs than yours.</div><div><br></div><div>You can read about it in this paper:</div><div><a href="https://ufal.mff.cuni.cz/pbml/100/art-rousseau.pdf">https://ufal.mff.cuni.cz/pbml/100/art-rousseau.pdf</a></div><div><br></div><div>Source code of the tool can be found here:</div><div><a href="https://github.com/rousseau-lium/XenC">https://github.com/rousseau-lium/XenC</a></div><div><br></div><div>Best regards,</div><div>
<br><div apple-content-edited="true">
<div style="color: rgb(0, 0, 0); letter-spacing: normal; orphans: auto; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; widows: auto; word-spacing: 0px; -webkit-text-stroke-width: 0px; word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space;">—</div><div style="color: rgb(0, 0, 0); letter-spacing: normal; orphans: auto; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; widows: auto; word-spacing: 0px; -webkit-text-stroke-width: 0px; word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space;">Anthony Rousseau, Ph.D.<br>LIUM, University of Le Mans<br><a href="mailto:anthony.rousseau@lium.univ-lemans.fr">anthony.rousseau@lium.univ-lemans.fr</a><br><br></div>
</div>
<br><div><div>Le 16 janv. 2014 à 16:43, Saeed Farzi <<a href="mailto:saeedfarzi@gmail.com">saeedfarzi@gmail.com</a>> a écrit :</div><br class="Apple-interchange-newline"><blockquote type="cite">Dear all,<br><br>I am working on a translation task with a very large parallel corpus.<br>Because of computational cost of training such a parallel corpus, i am<br>going to filter it regarding to the test set ( of course , by the<br>filtering, the evaluation must be still fair).<br><br>I am looking for  a solution  or a tool for filtering parallel corpus sentences.<br><br>Note that  i do not need to filter phrase table. I know that the<br>filter_ moses tool reduces the phrase table size.<br><br>cheers<br>-- <br>           S.Farzi, Ph.D. Student<br>    Natural Language Processing Lab,<br>  School of Electrical and Computer Eng.,<br>               Tehran University<br>             Tel: +9821-6111-9719<br>_______________________________________________<br>Moses-support mailing list<br><a href="mailto:Moses-support@mit.edu">Moses-support@mit.edu</a><br>http://mailman.mit.edu/mailman/listinfo/moses-support<br></blockquote></div><br></div></body></html>