<div>Hi Nasrin,</div><div>You can get the snapshot of Wikipedia in different languages at the following sites</div><a href="http://dumps.wikimedia.org/backup-index.html">http://dumps.wikimedia.org/backup-index.html</a> <div>

<br></div><div>More description about dump processing goes to</div><div><a href="http://en.wikipedia.org/wiki/Wikipedia:Database_download">http://en.wikipedia.org/wiki/Wikipedia:Database_download</a>
</div><div><br></div><div>There're several parser for extracting elements from the xml dump file.</div><div>e.g. </div><div><div><a href="http://medialab.di.unipi.it/wiki/Wikipedia_Extractor">medialab.di.unipi.it/wiki/Wikipedia_Extractor</a></div>

<div><a href="http://wikipedia-miner.sourceforge.net">wikipedia-miner.sourceforge.net</a></div></div><div><br></div><div>The Wikimedia dump site also provide sql files from inter language links between languages,</div><div>

Never use that. Simply try them if you want.</div><div><br></div><div> Happy Hacking!!</div><div><br></div><div><span style="color:rgb(0,153,51);font-family:arial,sans-serif;line-height:12px;background-color:rgb(255,255,255)"><br>

</span></div><div><font color="#009933" face="arial, sans-serif"><span style="line-height:12px"><br></span></font></div><div><br><div class="gmail_quote">On Fri, Jun 15, 2012 at 8:49 AM, Nasrin Baratali <span dir="ltr"><<a href="mailto:nasrin.baratali@gmail.com" target="_blank">nasrin.baratali@gmail.com</a>></span> wrote:<br>

<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">







<p>To whom it may concern,</p>
<p>I want to access pages in the Wikipedia that have different language and their content are nearly equivalent or exactly equivalent. It seems Interlanguage links have enough information for me. However  I do not know how I could extract these links or equivalent pages. I would be appreciate if any one could help me.</p>



<p>Regards,</p>
<p>Nasrin Baratalipour</p>
<br>_______________________________________________<br>
UNSUBSCRIBE from this page: <a href="http://mailman.uib.no/options/corpora" target="_blank">http://mailman.uib.no/options/corpora</a><br>
Corpora mailing list<br>
<a href="mailto:Corpora@uib.no">Corpora@uib.no</a><br>
<a href="http://mailman.uib.no/listinfo/corpora" target="_blank">http://mailman.uib.no/listinfo/corpora</a><br>
<br></blockquote></div><br><br clear="all"><div><br></div>-- <br><span style="border-collapse:collapse;color:rgb(136,136,136);font-family:arial,sans-serif;font-size:13px"><font color="#330000">XU Fang  徐昉<br></font><span style="border-collapse:collapse;font-family:arial,sans-serif;font-size:13px"><font color="#330000">Spoken Language Systems<br>

Saarland University<br>66041 Saarbrücken<br>Tel. <a value="+4968130258122" style="color:rgb(92,69,32)">++49 681 302 58128</a><br>Fax <a value="+4968130258123" style="color:rgb(92,69,32)">++49 681 302 58123</a><br><a href="mailto:fang.xu@LSV.Uni-Saarland.De" style="color:rgb(92,69,32)" target="_blank">Fang.Xu@LSV.Uni-Saarland.De</a></font></span></span><br>


</div>