<div dir="ltr"><div><div><div>Hi Javid,<br></div>If you have a parallel corpus, you can use an alignment tool such as Giza++ or fast-aligner to get word alignments. You can run the alignment in both directions to get a bi-directional dictionary.<br></div>If your corpus is comparable (which I understand as not completely parallel, but I may be wrong here), then a tool like hungalign can help extract the parallel sentences, which you can then use for building your dictionary.<br></div><div>HTH,<br></div><div>Emad<br></div></div><div class="gmail_extra"><br><div class="gmail_quote">On Sun, Oct 5, 2014 at 1:00 PM, javid dadashkarimi <span dir="ltr"><<a href="mailto:javiddadashkarimi@gmail.com" target="_blank">javiddadashkarimi@gmail.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr"><div class="gmail_default" style="font-family:trebuchet ms,sans-serif">Dear Ramesh,<br></div><div class="gmail_default" style="font-family:trebuchet ms,sans-serif">I only want to extract dictionary within an aligned bilingual corpus. I know that Moses can do it for parallel and sentence-level aligned corpus, but are the tools like SketchEngine or Tshwanelex extracting such a knowledge?<br></div><div class="gmail_default" style="font-family:trebuchet ms,sans-serif">Best,<br>Javid<br></div></div><div class="HOEnZb"><div class="h5"><div class="gmail_extra"><br><div class="gmail_quote">On Sun, Oct 5, 2014 at 7:23 PM, Krishnamurthy, Ramesh <span dir="ltr"><<a href="mailto:r.krishnamurthy@aston.ac.uk" target="_blank">r.krishnamurthy@aston.ac.uk</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">hi javid<br>
not sure quite what you want,<br>
but i'd suggest contacting the<br>
people at SketchEngine<br>
<a href="http://www.sketchengine.co.uk/" target="_blank">http://www.sketchengine.co.uk/</a><br>
and Tshwanelex<br>
<a href="http://tshwanedje.com/tshwanelex/" target="_blank">http://tshwanedje.com/tshwanelex/</a><br>
best<br>
ramesh<br>
-------------<br>
Date: Sat, 4 Oct 2014 15:11:02 +0330<br>
From: javid dadashkarimi <<a href="mailto:javiddadashkarimi@gmail.com" target="_blank">javiddadashkarimi@gmail.com</a>><br>
Subject: [Corpora-List] Bilingual Dictionary from Comparable Corpora<br>
To: <a href="mailto:corpora@uib.no" target="_blank">corpora@uib.no</a>, <a href="mailto:gate-users-request@lists.sourceforge.net" target="_blank">gate-users-request@lists.sourceforge.net</a><br>
<br>
Hi,<br>
Is there any tool for extracting probabilistic bilingual dictionary for a<br>
bilingual comparable corpora? Does Moses support such a task?<br>
Best,<br>
Javid<br>
</blockquote></div><br></div>
</div></div><br>_______________________________________________<br>
UNSUBSCRIBE from this page: <a href="http://mailman.uib.no/options/corpora" target="_blank">http://mailman.uib.no/options/corpora</a><br>
Corpora mailing list<br>
<a href="mailto:Corpora@uib.no">Corpora@uib.no</a><br>
<a href="http://mailman.uib.no/listinfo/corpora" target="_blank">http://mailman.uib.no/listinfo/corpora</a><br>
<br></blockquote></div><br><br clear="all"><br>-- <br><div dir="ltr"><font size="1">Emad Mohamed<br><br></font></div>
</div>