Thanks for the Spanish corpus. I have some other questions to ask you all...<br><ol><li>Do you know a similar corpus for Turkish (other than METU corpus <a href="http://www.ii.metu.edu.tr/%7Ecorpus/">http://www.ii.metu.edu.tr/~corpus/
</a>). <br></li><li>Also I would like to know if you could advise me a morphological parser for Turkish that I can find the root and suffix (and even prefix which are few like eş- /esh/ eşzamanlı --> synchronous).</li>
<li>An automatic lemmatizer for Turkish...</li></ol>Thanks in advance...<br>-- <br>EMRAH ÖZCAN (M.A.)<br>Araş. Gör.<br><br>Yıldız Teknik Üniversitesi / Yildiz Technical University<br>Eğitim Fakültesi / Faculty of Education             
<br>Yabancı Diller Eğitimi Böl. / Foreign Languages Teaching Dept.<br>Davutpaşa Yerleşkesi / Campus at Davutpasa<br>Esenler, İstanbul <br>Türkiye<br><br>posta: eozcan {@} <a href="http://yildiz.edu.tr">yildiz.edu.tr</a><br>
telefon: +90 212 449 1616<br>ağ sayfası: <a href="http://www.dil.yildiz.edu.tr/emrah">http://www.dil.yildiz.edu.tr/emrah</a><br><br><br><div><span class="gmail_quote">On 2/2/07, <b class="gmail_sendername">Serge Sharoff</b>
 <<a href="mailto:s.sharoff@leeds.ac.uk">s.sharoff@leeds.ac.uk</a>> wrote:</span><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">yes, the frequency list is also available:
<br><a href="http://corpus.leeds.ac.uk/frqc/internet-es-forms.num">http://corpus.leeds.ac.uk/frqc/internet-es-forms.num</a> (for word forms)<br><a href="http://corpus.leeds.ac.uk/frqc/internet-es.num">http://corpus.leeds.ac.uk/frqc/internet-es.num
</a> (for lemmas, though you'd<br>better take the results of automatic lemmatisation with caution).<br><br>BTW, the frequencies (the second column) are in terms of ipm (instances<br>per million words).<br><br>Serge<br>
<br>On Thu, 2007-02-01 at 14:17 +0100, Mario Crespo Miguel wrote:<br>> Thank you very much for helping me, but I think it is more<br>> convenient for me if the frequencies of the words of this open<br>> domain / general corpus could be obtained. Does anybody know if
<br>> such an information is available some way? Best,<br>><br>> Mario<br>><br>><br>><br>> El dia 30 ene 2007 16:10, Serge Sharoff <<a href="mailto:s.sharoff@leeds.ac.uk">s.sharoff@leeds.ac.uk</a>>
<br>> escribió:<br>><br>> > one answer is the Spanish Internet corpus with the interface from<br>> > <a href="http://corpus.leeds.ac.uk/internet.html">http://corpus.leeds.ac.uk/internet.html</a><br>> > and the URL list
<br>> > <a href="http://corpus.leeds.ac.uk/internet/final-url-es.gz">http://corpus.leeds.ac.uk/internet/final-url-es.gz</a><br>> ><br>> > This is a random snapshot of the Spanish Internet of about 120<br>
> > million<br>> > words, see<br>> > Sharoff, S (2006) Creating general-purpose corpora using<br>> > automated<br>> > search engine queries. In Marco Baroni and Silvia Bernardini,<br>> > editors,
<br>> > WaCky! Working papers on the Web as Corpus. Gedit, Bologna.<br>> > <a href="http://wackybook.sslmit.unibo.it/">http://wackybook.sslmit.unibo.it/</a><br>> ><br>> > S<br>> ><br>> > On Tue, 2007-01-30 at 15:54 +0100, Mario Crespo Miguel wrote:
<br>> >> Dear everybody,<br>> >><br>> >> Thank you again for all the help that I always get with this<br>> >> mailing list, and  this time I would like to ask if there is<br>> >> some reference / open-domain corpus for Spanish which is freely
<br>> >> available and could be downloaded. Thank you in advance. Best<br>> >> wishes,<br>> >><br>> >> Mario Crespo Miguel<br>> >><br>> >><br>> ><br>> ><br>
><br>><br>><br>><br><br></blockquote></div><br><br clear="all"><br><br>