<html dir="ltr">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
<style type="text/css" style="">
<!--
p
        {margin-top:0px;
        margin-bottom:0px}
@font-face
        {font-family:SimSun}
@font-face
        {font-family:Calibri}
@font-face
        {font-family:Tahoma}
p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0cm 0cm 0.0001pt;
        font-size:12pt;
        font-family:'Times New Roman',serif}
a:link, span.MsoHyperlink
        {color:blue;
        text-decoration:underline}
a:visited, span.MsoHyperlinkFollowed
        {color:purple;
        text-decoration:underline}
span.EmailStyle17
        {font-family:Calibri,sans-serif;
        color:rgb(31,73,125)}
.MsoChpDefault
        {font-family:Calibri,sans-serif}
@page WordSection1
        {margin:70.85pt}
-->
</style><style type="text/css" id="owaParaStyle"></style>
</head>
<body dir="ltr" style="background-color: rgb(255, 255, 255);" fpstyle="1" ocsi="0">
<div style="direction: ltr;font-family: Tahoma;color: #000000;font-size: 10pt;"><font face="Tahoma, Geneva, sans-serif"><span style="font-size: 10pt;">Thanks to all who have contributed to this thread - I have really enjoyed it. Khalid made a passing reference
 to the UK position - this has recently become quite permissive for non-commercial text mining research, but we have been debating back and forth in Lancaster exactly what this means for corpus linguists. Due to the case-law nature of English Law we won't really
 know until some cases have been brought forward and we are able to see how the laws/regulations are to be interpreted, hence Khalid's comment about the situation being unclear, I assume. Anyway, for those of you interested in the new exceptions to copyright
 in the UK, you can read all about it here:</span></font>
<div style="color: rgb(0, 0, 0); font-family: Tahoma, Geneva, sans-serif; font-size: 10pt;">
<br>
</div>
<div><font face="Tahoma, Geneva, sans-serif">https://www.gov.uk/government/uploads/system/uploads/attachment_data/file/375951/Education_and_Teaching.pdf</font><br>
<div style="color: rgb(0, 0, 0); font-family: Tahoma, Geneva, sans-serif; font-size: 10pt;">
<br>
<div style="font-family:Tahoma; font-size:13px"> </div>
</div>
<div style="color: rgb(0, 0, 0); font-family: 'Times New Roman'; font-size: 16px;">
<hr tabindex="-1">
<div id="divRpF417969" style="direction: ltr;"><font face="Tahoma" size="2" color="#000000"><b>From:</b> corpora-bounces@uib.no [corpora-bounces@uib.no] on behalf of Mark Davies [Mark_Davies@byu.edu]<br>
<b>Sent:</b> 06 January 2015 13:36<br>
<b>To:</b> corpora@uib.no<br>
<b>Subject:</b> Re: [Corpora-List] Copyright question again<br>
</font><br>
</div>
<div></div>
<div>
<p>Marc Brysbaert wrote:<br>
</p>
<p><br>
</p>
<p>>> <span style="color:rgb(31,73,125); font-family:Calibri,sans-serif; font-size:11pt">For what it is worth, in my experience word frequency lists and N-gram lists are not a problem. </span></p>
<div><span style="font-size:11pt; font-family:Calibri,sans-serif; color:rgb(31,73,125)"><br>
</span></div>
<div><span style="font-size:11pt; font-family:Calibri,sans-serif; color:rgb(31,73,125)">I agree. I've distributed COCA/COHA word frequency (http://www.wordfrequency.info) and n-grams (http://www.ngrams.info) data for several years now, and I've never had any
 issues.</span></div>
<p><br>
</p>
<p>>> <span style="color:rgb(31,73,125); font-family:Calibri,sans-serif; font-size:15px; background-color:rgb(255,255,255)">The big problem we are encountering is that currently there is no guidance about whether corpora can be shared. As a result, nearly all
 corpora assembled remain next to inaccessible, meaning that everyone has to collect their own corpus. This is a lot of needless work and also means that little cumulative work can be done.</span><br>
</p>
<p><br>
</p>
<p>I've also been distributing "full-text" data from 450 million word COCA and the 1.9 billion word GloWbE (http://corpus.byu.edu/glowbe) for a while now, and again no problems to this point. There is a "twist", though, in terms of how the full-text data has
 been slightly altered to avoid copyright problems:<br>
</p>
<p><br>
</p>
<p><a href="http://corpus.byu.edu/full-text/limitations.asp" target="_blank">http://corpus.byu.edu/full-text/limitations.asp</a><br>
</p>
<p><br>
</p>
<p>​Best,<br>
</p>
<p><br>
</p>
<p>Mark D.<br>
</p>
<p><br>
</p>
<div id="Signature">
<div style="font-family:Tahoma; font-size:13px">
<div style="font-family:Tahoma; font-size:13px">
<p>============================================<br>
Mark Davies<br>
Professor of Linguistics / Brigham Young University<br>
<a tabindex="0" href="http://davies-linguistics.byu.edu/" target="_blank">http://davies-linguistics.byu.edu/</a></p>
<p>** Corpus design and use // Linguistic databases **<br>
** Historical linguistics // Language variation **<br>
** English, Spanish, and Portuguese **<br>
============================================<br>
</p>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</body>
</html>