<div dir="ltr">Hi,<br>I know one PhD student in Iran has prepared a little NER corpus on Bijankhan corpus content: <a href="mailto:majid.asgari@gmail.com">majid.asgari@gmail.com</a>. You can simply ask him.<br><br>For countries there is a wiki page: <a href="http://fa.wikipedia.org/wiki/%D9%81%D9%87%D8%B1%D8%B3%D8%AA_%DA%A9%D8%B4%D9%88%D8%B1%D9%87%D8%A7%DB%8C_%D8%AC%D9%87%D8%A7%D9%86_%D8%A8%D8%B1_%D8%A7%D8%B3%D8%A7%D8%B3_%D8%A7%D9%84%D9%81%D8%A8%D8%A7%DB%8C_%D9%81%D8%A7%D8%B1%D8%B3%DB%8C" target="_blank">http://fa.wikipedia.org/wiki/%D9%81%D9%87%D8%B1%D8%B3%D8%AA_%DA%A9%D8%B4%D9%88%D8%B1%D9%87%D8%A7%DB%8C_%D8%AC%D9%87%D8%A7%D9%86_%D8%A8%D8%B1_%D8%A7%D8%B3%D8%A7%D8%B3_%D8%A7%D9%84%D9%81%D8%A8%D8%A7%DB%8C_%D9%81%D8%A7%D8%B1%D8%B3%DB%8C</a><br>

<br>Best regards<br><br><div class="gmail_quote">On Wed, Oct 10, 2012 at 2:17 PM, Francis Tyers <span dir="ltr"><<a href="mailto:ftyers@prompsit.com" target="_blank">ftyers@prompsit.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">

El dc 10 de 10 de 2012 a les 13:41 -0400, en/na Yorick Wilks va<br>
escriure:<br>
<div>> Does anyone have available (or know where to find) a list in Farsi script of<br>
> * person names<br>
> * place names<br>
> * countries<br>
><br>
> I would be very grateful for any help, and lists of any size...<br>
> Yorick Wilks<br>
<br>
</div>Wikipedia can be pretty good for proper name lists. Jon Dehdari<br>
extracted some stuff here:<br>
<br>
<a href="http://www.ling.ohio-state.edu/~jonsafari/" target="_blank">http://www.ling.ohio-state.edu/~jonsafari/</a><br>
Persian - English dictionary - 105,000 entries, UTF-8, derived from<br>
Wikipedia, under the CC-BY-SA 3.0 (mostly proper nouns)<br>
<br>
If you need them categorised, you could extract the information from the<br>
Wikipedia category system.<br>
<br>
Fran<br>
<div><div><br>
<br>
_______________________________________________<br>
UNSUBSCRIBE from this page: <a href="http://mailman.uib.no/options/corpora" target="_blank">http://mailman.uib.no/options/corpora</a><br>
Corpora mailing list<br>
<a href="mailto:Corpora@uib.no" target="_blank">Corpora@uib.no</a><br>
<a href="http://mailman.uib.no/listinfo/corpora" target="_blank">http://mailman.uib.no/listinfo/corpora</a><br>
</div></div></blockquote></div><br><br clear="all"><br>-- <br><div dir="ltr">Mohammad Sadegh Rasooli<br>PhD Student, Computer Science Department, Columbia University<br>Research Assistant, Center for Computational Learning Systems, Columbia University</div>

<br>
</div>