<html xmlns:v="urn:schemas-microsoft-com:vml" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40">

<head>
<meta http-equiv=Content-Type content="text/html; charset=utf-8">
<meta name=Generator content="Microsoft Word 12 (filtered medium)">
<style>
<!--
 /* Font Definitions */
 @font-face
        {font-family:Cambria;
        panose-1:2 4 5 3 5 4 6 3 2 4;}
@font-face
        {font-family:Calibri;
        panose-1:2 15 5 2 2 2 4 3 2 4;}
@font-face
        {font-family:Tahoma;
        panose-1:2 11 6 4 3 5 4 4 2 4;}
@font-face
        {font-family:Consolas;
        panose-1:2 11 6 9 2 2 4 3 2 4;}
 /* Style Definitions */
 p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0cm;
        margin-bottom:.0001pt;
        font-size:12.0pt;
        font-family:"Times New Roman","serif";
        color:#663300;}
a:link, span.MsoHyperlink
        {mso-style-priority:99;
        color:blue;
        text-decoration:underline;}
a:visited, span.MsoHyperlinkFollowed
        {mso-style-priority:99;
        color:purple;
        text-decoration:underline;}
pre
        {mso-style-priority:99;
        mso-style-link:"HTML Preformatted Char";
        margin:0cm;
        margin-bottom:.0001pt;
        font-size:10.0pt;
        font-family:"Courier New";
        color:#663300;}
span.HTMLPreformattedChar
        {mso-style-name:"HTML Preformatted Char";
        mso-style-priority:99;
        mso-style-link:"HTML Preformatted";
        font-family:Consolas;
        color:#663300;}
span.EmailStyle19
        {mso-style-type:personal-reply;
        font-family:"Calibri","sans-serif";
        color:#1F497D;}
.MsoChpDefault
        {mso-style-type:export-only;
        font-size:10.0pt;}
@page Section1
        {size:612.0pt 792.0pt;
        margin:72.0pt 72.0pt 72.0pt 72.0pt;}
div.Section1
        {page:Section1;}
-->
</style>
<!--[if gte mso 9]><xml>
 <o:shapedefaults v:ext="edit" spidmax="1026" />
</xml><![endif]--><!--[if gte mso 9]><xml>
 <o:shapelayout v:ext="edit">
  <o:idmap v:ext="edit" data="1" />
 </o:shapelayout></xml><![endif]-->
</head>

<body bgcolor=white lang=EN-US link=blue vlink=purple>

<div class=Section1>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>You can use also TMC (Tehran monolingual corpus: also release
from Univ. of Tehran) which contains about 250M words , just tokenized …<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'><a href="http://ece.ut.ac.ir/nlp/resources.html">http://ece.ut.ac.ir/nlp/resources.html</a><o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'><o:p> </o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Heshaam<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'><o:p> </o:p></span></p>

<div>

<div style='border:none;border-top:solid #B5C4DF 1.0pt;padding:3.0pt 0cm 0cm 0cm'>

<p class=MsoNormal><b><span style='font-size:10.0pt;font-family:"Tahoma","sans-serif";
color:windowtext'>From:</span></b><span style='font-size:10.0pt;font-family:
"Tahoma","sans-serif";color:windowtext'> corpora-bounces@uib.no
[mailto:corpora-bounces@uib.no] <b>On Behalf Of </b>Khalid CHOUKRI<br>
<b>Sent:</b> Thursday, September 01, 2011 9:28 PM<br>
<b>To:</b> Yorick Wilks<br>
<b>Cc:</b> corpora@uib.no<br>
<b>Subject:</b> Re: [Corpora-List] Farsi corpora<o:p></o:p></span></p>

</div>

</div>

<p class=MsoNormal><o:p> </o:p></p>

<p class=MsoNormal><span style='font-family:"Cambria","serif"'>Hi Yorick<br>
<br>
some Farsi resources are available from ELRA catalogue (including an
English-Persian parallel Corpus)<br>
Just search Farsi on <a href="http://catalog.elra.info/search.php">http://catalog.elra.info/search.php</a><br>
<br>
best regards<br>
Khalid<br>
<br>
</span><br>
Yorick Wilks wrote, On 31/08/2011 22:23: <o:p></o:p></p>

<pre>Thanks to everyone for very useful pointers.<o:p></o:p></pre><pre>YW<o:p></o:p></pre><pre><o:p> </o:p></pre><pre><o:p> </o:p></pre><pre>On 31 Aug 2011, at 16:20, Jon Dehdari wrote:<o:p></o:p></pre><pre><o:p> </o:p></pre>

<blockquote style='margin-top:5.0pt;margin-bottom:5.0pt'><pre>Hello,<o:p></o:p></pre><pre>There are a couple different public-domain/Free news corpora here:<o:p></o:p></pre><pre><a
href="http://ling.ohio-state.edu/~jonsafari/corpora">http://ling.ohio-state.edu/~jonsafari/corpora</a><o:p></o:p></pre><pre><o:p> </o:p></pre><pre>The Hamshahri newspaper corpus is available here:<o:p></o:p></pre><pre><a
href="http://ece.ut.ac.ir/dbrg/Hamshahri">http://ece.ut.ac.ir/dbrg/Hamshahri</a><o:p></o:p></pre><pre><o:p> </o:p></pre><pre>The POS-tagged Bijankhan newspaper corpus is available here:<o:p></o:p></pre><pre><a
href="http://ece.ut.ac.ir/dbrg/Bijankhan">http://ece.ut.ac.ir/dbrg/Bijankhan</a><o:p></o:p></pre><pre><o:p> </o:p></pre><pre>And more information here:<o:p></o:p></pre><pre><a
href="http://www.iranianlinguistics.org/wiki/index.php?title=Persian#Corpora">http://www.iranianlinguistics.org/wiki/index.php?title=Persian#Corpora</a><o:p></o:p></pre><pre><o:p> </o:p></pre><pre><o:p> </o:p></pre><pre>Cheers,<o:p></o:p></pre><pre>-Jon Dehdari<o:p></o:p></pre><pre><o:p> </o:p></pre><pre><o:p> </o:p></pre><pre>On Wed, Aug 31, 2011 at 03:54:31PM -0400, Yorick Wilks wrote:<o:p></o:p></pre>

<blockquote style='margin-top:5.0pt;margin-bottom:5.0pt'><pre><o:p> </o:p></pre><pre>Is anyone aware of easily obtained Farsi corpora---domain not important?<o:p></o:p></pre><pre>I'd be grateful for pointers.<o:p></o:p></pre><pre>Yorick Wilks<o:p></o:p></pre></blockquote>

</blockquote>

<pre><o:p> </o:p></pre><pre><o:p> </o:p></pre><pre><o:p> </o:p></pre><pre>_______________________________________________<o:p></o:p></pre><pre>UNSUBSCRIBE from this page: <a
href="http://mailman.uib.no/options/corpora">http://mailman.uib.no/options/corpora</a><o:p></o:p></pre><pre>Corpora mailing list<o:p></o:p></pre><pre><a
href="mailto:Corpora@uib.no">Corpora@uib.no</a><o:p></o:p></pre><pre><a
href="http://mailman.uib.no/listinfo/corpora">http://mailman.uib.no/listinfo/corpora</a><o:p></o:p></pre><pre><o:p> </o:p></pre></div>

</body>

</html>