Dear Morteza,<div><br></div><div>Yes, you definitely should cite the corpus.</div><div><br></div><div>It is always likely that your POS-tagger will have failings because of characteristics of the corpus it was trained on.  People should be able to look at it in this light, with an account of how the corpus was prepared, available to them.</div>

<div><br></div><div>Sometimes there is no obvious way to cite the corpus.  Sometimes a URL is best (which is what I do for example for the BNC, as the website is long-life and with full and good documentation, and the only alternative is to a technical report that no-one is actually going to track down).  As a producer of corpora, I aim to write them up in a paper that is easy to find and to read and serves as a reference.</div>

<div><br></div><div> Adam</div><div><br><div class="gmail_quote">On 7 March 2013 06:27, M. Rezaei <span dir="ltr"><<a href="mailto:mrezaeis@mehr.sharif.ir" target="_blank">mrezaeis@mehr.sharif.ir</a>></span> wrote:<br>

<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr"><div><font face="tahoma,sans-serif">Dear all,</font></div><font face="tahoma,sans-serif"><div>Salam.</div>

</font><div><font face="tahoma,sans-serif">Suppose I use a text corpus and I extract some statistical information from it or I train a POS tagger based on it. Well, I have used the corpus, but I have not directly used the paper which describes it i.e. I have not quoted a paragraph from the paper in my research. Is there any standard style for citing the corpus itself, as a data set? Is it a good idea to do so? What about the corpus authors, do they prefer users to cite their paper rather than the corpus itself?</font></div>



<div><font face="tahoma, sans-serif">Looking forward to receiving your responses.</font></div><div><font face="tahoma, sans-serif">Best Regards</font></div><div><font face="tahoma, sans-serif">Morteza Rezaei</font></div>



</div>
<br>_______________________________________________<br>
UNSUBSCRIBE from this page: <a href="http://mailman.uib.no/options/corpora" target="_blank">http://mailman.uib.no/options/corpora</a><br>
Corpora mailing list<br>
<a href="mailto:Corpora@uib.no">Corpora@uib.no</a><br>
<a href="http://mailman.uib.no/listinfo/corpora" target="_blank">http://mailman.uib.no/listinfo/corpora</a><br>
<br></blockquote></div><br><br clear="all"><div><br></div>-- <br>========================================<br><a href="http://www.kilgarriff.co.uk/" target="_blank">Adam Kilgarriff</a>                  <a href="mailto:adam@lexmasterclass.com" target="_blank">adam@lexmasterclass.com</a>                                             <br>

Director                                    <a href="http://www.sketchengine.co.uk/" target="_blank">Lexical Computing Ltd</a>                <br>Visiting Research Fellow                 <a href="http://leeds.ac.uk" target="_blank">University of Leeds</a>     <div>

<i><font color="#006600">Corpora for all</font></i> with <a href="http://www.sketchengine.co.uk" target="_blank">the Sketch Engine</a>                 </div><div>                        <i><a href="http://www.webdante.com" target="_blank">DANTE: <font color="#009900">a lexical database for English</font></a><font color="#009900"> </font>                 </i><div>

========================================</div></div>
</div>