<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
<html>
<head>
  <meta content="text/html; charset=ISO-8859-1"
 http-equiv="Content-Type">
</head>
<body text="#000000" bgcolor="#ffffff">
On 10/09/2012 01:37 PM, Krishnamurthy, Ramesh wrote:
<blockquote
 cite="mid:114335AAA47F3744BDD9720D7A2F700A484074A7@exch-mb-g50-01.campus.aston.ac.uk"
 type="cite">
  <pre wrap="">I think you need to:

a) consider copyright issues, if you intend to use the corpus for commercial purposes
  </pre>
</blockquote>
Hi Meganathan,<br>
<br>
A corpus is only really useful if it can be shared, at least for
research purposes, if not also commercial ones.<br>
<br>
To be able do that, Intellectual Property Rights (IPR) issues need to
be settled.<br>
<br>
How we have gone about that for the 500 million word reference corpus
of contemporary written Dutch SoNaR is detailed in: <br>
<br>
De Clercq O. and Reynaert M., (2010), <a
 onclick="urchinTracker('/downloads/taal/technologie/stevin/documenten/sonar_manual.pdf');"
 href="http://taalunieversum.org/taal/technologie/stevin/documenten/sonar_manual.pdf">SoNaR

Acquisition Manual</a>, LT3 Technical Report LT3 10-02, Hogeschool
Gent, Gent, Belgium<br>
<br>
<a class="moz-txt-link-freetext" href="http://lt3.hogent.be/media/uploads/publications/2010/DeClercq2010a.pdf">http://lt3.hogent.be/media/uploads/publications/2010/DeClercq2010a.pdf</a><br>
<br>
Success!<br>
<br>
Martin<br>
</body>
</html>