<div dir="ltr"><br>In a ddition to what Aziz mentioned,  you will need a word tokenizer/segmenter in order to handle the morphological richness of Arabic. Google Arabic tokenization for this. <br><div class="gmail_quote">On Tue, Aug 9, 2011 at 4:21 PM, True Friend <span dir="ltr"><<a href="mailto:true.friend2004@gmail.com">true.friend2004@gmail.com</a>></span> wrote:<br>
<blockquote style="margin: 0px 0px 0px 0.8ex; padding-left: 1ex; border-left-color: rgb(204, 204, 204); border-left-width: 1px; border-left-style: solid;" class="gmail_quote"><div dir="ltr">Dear Montasser<br>You'll have to select a few newspapers of Egyptian English and then download the news items after 25 January. This can be done by a website downloader, or by an HTML Crawler, or you can write your own script (if you know how to write one in Python, Pearl etc).<br>

Well it would be simple enough to get a word list.<br>Sorry I couldn't provide any technical and specific solution. :-)<br>Regards<br><font color="#888888">-- <br><div dir="ltr"><font style="color: rgb(51, 102, 255);" size="4"><b>Muhammad Shakir Aziz</b></font><span style="color: rgb(51, 102, 255);"> </span><font style="color: rgb(51, 102, 255);" size="4"><b><span style="font-family: tahoma,sans-serif;">محمد شاکر عزیز</span></b></font><br style="color: rgb(51, 102, 255);">

<b><span style="color: rgb(51, 102, 255); font-family: comic sans ms,sans-serif;">Masters in Applied Linguistics</span><br style="color: rgb(51, 102, 255); font-family: comic sans ms,sans-serif;"><span style="color: rgb(51, 102, 255); font-family: comic sans ms,sans-serif;">Translator, Course Developer, Linguist for Urdu, Punjabi and English</span></b><br style="color: rgb(51, 102, 255);">

<span style="color: rgb(51, 102, 255); font-family: courier new,monospace;">Urdu:- </span><a style="color: rgb(51, 102, 255); font-family: courier new,monospace;" href="http://awaz-e-dost.blogspot.com/" target="_blank">http://awaz-e-dost.blogspot.com/</a><br style="color: rgb(51, 102, 255); font-family: courier new,monospace;">

<span style="color: rgb(51, 102, 255); font-family: courier new,monospace;">English:- </span><a style="color: rgb(51, 102, 255); font-family: courier new,monospace;" href="http://linguisticslearner.blogspot.com/" target="_blank">http://linguisticslearner.blogspot.com/</a><br style="color: rgb(51, 102, 255); font-family: courier new,monospace;">

<span style="color: rgb(51, 102, 255); font-family: courier new,monospace;">Facebook:- </span><a style="color: rgb(51, 102, 255); font-family: courier new,monospace;" href="http://www.facebook.com/truefriend2004" target="_blank">http://www.facebook.com/truefriend2004</a><br style="color: rgb(51, 102, 255); font-family: courier new,monospace;">

<span style="color: rgb(51, 102, 255); font-family: courier new,monospace;">Skype:- true_friend2004</span></div><br>
</font></div>
<br>_______________________________________________<br>
UNSUBSCRIBE from this page: <a href="http://mailman.uib.no/options/corpora" target="_blank">http://mailman.uib.no/options/corpora</a><br>
Corpora mailing list<br>
<a href="mailto:Corpora@uib.no">Corpora@uib.no</a><br>
<a href="http://mailman.uib.no/listinfo/corpora" target="_blank">http://mailman.uib.no/listinfo/corpora</a><br>
<br></blockquote></div><br><br clear="all"><br>-- <br><div dir="ltr"><font size="1"><span style="color: rgb(255, 0, 0); font-family: comic sans ms,sans-serif; background-color: rgb(255, 204, 51);">Emad Soliman Ali Mohamed </span><br style="color: rgb(255, 0, 0); font-family: comic sans ms,sans-serif; background-color: rgb(255, 204, 51);">
<span style="color: rgb(255, 0, 0); font-family: comic sans ms,sans-serif; background-color: rgb(255, 204, 51);">aka Emad Nawfal </span><span style="color: rgb(255, 0, 0); font-family: "comic sans ms", sans-serif;">(<b>عماد نوفل</b>)</span><br style="color: rgb(255, 0, 0); font-family: comic sans ms,sans-serif; background-color: rgb(255, 204, 51);">
<span style="color: rgb(255, 0, 0); font-family: comic sans ms,sans-serif; background-color: rgb(255, 204, 51);">PhD in Linguistics, Computational Linguistics Track,</span></font><div><font size="1"><span style="color: rgb(255, 0, 0); font-family: comic sans ms,sans-serif; background-color: rgb(255, 204, 51);">Department of Linguistics,</span><br style="color: rgb(255, 0, 0); font-family: comic sans ms,sans-serif; background-color: rgb(255, 204, 51);">
<span style="color: rgb(255, 0, 0); font-family: comic sans ms,sans-serif; background-color: rgb(255, 204, 51);">Indiana University, Bloomington</span><br style="color: rgb(255, 0, 0); font-family: comic sans ms,sans-serif; background-color: rgb(255, 204, 51);">
<span style="color: rgb(255, 0, 0); font-family: comic sans ms,sans-serif; background-color: rgb(255, 204, 51);"><a href="http://jones.ling.indiana.edu/~emadnawfal" target="_blank">http://jones.ling.indiana.edu/~emadnawfal</a></span></font></div>
</div><br>
</div>