> ...and a "dump" such as this couldn't be further from qualifying as a corpus, if defined as "a > collection of pieces of language, selected and ordered according to explicit linguistic criteria > in order to be used as a sample of the language.”<br>

<br><div>Sorry, Martin, but your definition of 'corpus' reads like it's designed to strangle the life out of corpus linguistics. It begs questions about selection and ordering (?? how does ordering come into it?) and explicit linguistic criteria, and demotes many things that people refer to as 'corpora' to a lower form of life.   Lexicographically, bad.  </div>

<div><br></div><div>I think it's a dream of some corpus linguists as to what they think a corpus should be, not a fact about how the word is used.  But, delete the middle clause and we're in agreement:  </div><div>

   "a collection of pieces of language, used as a sample of the language"</div><div><br></div><div>Adam<br><div><br><div class="gmail_quote">On 2 March 2010 22:55, Martin Wynne <span dir="ltr"><<a href="mailto:martin.wynne@oucs.ox.ac.uk">martin.wynne@oucs.ox.ac.uk</a>></span> wrote:<br>

<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex;">Francis Tyers wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
El dt 02 de 03 de 2010 a les 12:38 +0100, en/na Xin Yan va escriure:<div class="im"><br>
  <br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
Hello,<br>
<br>
can anyone tell me, if there are some free text corpora for commercial purpose?<br>
Thank you in advance!<br>
    <br>
</blockquote>
<br></div>
You can download dumps of Wikipedia from <a href="http://download.wikimedia.org" target="_blank">http://download.wikimedia.org</a><br>
-- they are licensed under the CC-BY-SA or GFDL -- both of which allow<br>
commercial use, providing changes made are redistributed under the same<br>
licence.<br>
<br>
Best regards,<br>
<br>
Fran<div class="im"><br>
<br>
<br>
_______________________________________________<br>
Corpora mailing list<br>
<a href="mailto:Corpora@uib.no" target="_blank">Corpora@uib.no</a><br>
<a href="http://mailman.uib.no/listinfo/corpora" target="_blank">http://mailman.uib.no/listinfo/corpora</a><br>
  <br>
</div></blockquote>
<br>
Dumps of wikipedia may be an interesting electronic text collection that can be used to help address various linguistic research questions, but I think that the request was for a corpus...and a "dump" such as this couldn't be further from qualifying as a corpus, if defined as "a collection of pieces of language, selected and ordered according to explicit linguistic criteria in order to be used as a sample of the language.”<br>


<br>
The good news is that corpora are available. If you let us know what sort of corpus you are looking for and for what sort of commercial uses you intend to put them to, I am sure that there are plenty of people here on the mailing list who can help you.<br>


<br>
Martin<br>
Oxford Text Archive<div><div></div><div class="h5"><br>
<br>
_______________________________________________<br>
Corpora mailing list<br>
<a href="mailto:Corpora@uib.no" target="_blank">Corpora@uib.no</a><br>
<a href="http://mailman.uib.no/listinfo/corpora" target="_blank">http://mailman.uib.no/listinfo/corpora</a><br>
</div></div></blockquote></div><br><br clear="all"><br>-- <br>================================================<br>Adam Kilgarriff                                      <a href="http://www.kilgarriff.co.uk">http://www.kilgarriff.co.uk</a>              <br>

Lexical Computing Ltd                   <a href="http://www.sketchengine.co.uk">http://www.sketchengine.co.uk</a><br>Lexicography MasterClass Ltd      <a href="http://www.lexmasterclass.com">http://www.lexmasterclass.com</a><br>

Universities of Leeds and Sussex       <a href="mailto:adam@lexmasterclass.com">adam@lexmasterclass.com</a><br>================================================<br>
</div></div>