<html><head></head><body style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space; ">IANAL - but... from the GNU Licenses FAQ:<div><a href="http://www.gnu.org/licenses/gpl-faq.html#GPLOutput">http://www.gnu.org/licenses/gpl-faq.html#GPLOutput</a></div><div><a href="http://www.gnu.org/licenses/gpl-faq.html#CanIUseGPLToolsForNF">http://www.gnu.org/licenses/gpl-faq.html#CanIUseGPLToolsForNF</a></div><div><br></div><div><dt><b><a name="GPLOutput">Is there some way that
  I can GPL the output people get from use of my program?  For example,
  if my program is used to develop hardware designs, can I require that
  these designs must be free?</a></b></dt>

<dd><p>In general this is legally impossible; copyright law does not give you
any say in the use of the output people make from their data using
your program.  If the user uses your program to enter or convert his
own data, the copyright on the output belongs to him, not you.  More
generally, when a program translates its input into some other form,
the copyright status of the output inherits that of the input it was
generated from.</p><p>So the only way you have a say in the use of the output is if
substantial parts of the output are copied (more or less) from text in
your program.  For instance, part of the output of Bison (see above)
would be covered by the GNU GPL, if we had not made an exception in
this specific case.</p><p>You could artificially make a program copy certain text into its
output even if there is no technical reason to do so.  But if that
copied text serves no practical purpose, the user could simply delete
that text from the output and use only the rest.  Then he would not
have to obey the conditions on redistribution of the copied text</p></dd><div><div><div><dt><b><a name="CanIUseGPLToolsForNF">Can I use GPL-covered editors such as
  GNU Emacs to develop non-free programs?  Can I use GPL-covered tools
  such as GCC to compile them?</a></b></dt>

<dd><p>Yes, because the copyright on the editors and tools does not cover
the code you write.  Using them does not place any restrictions, legally,
on the license you use for your code.</p><p>Some programs copy parts of themselves into the output for technical
reasons—for example, Bison copies a standard parser program into its
output file.  In such cases, the copied text in the output is covered
by the same license that covers it in the source code.  Meanwhile, the
part of the output which is derived from the program's input inherits
the copyright status of the input.</p><p>As it happens, Bison can also be used to develop non-free programs.
This is because we decided to explicitly permit the use of the Bison
standard parser program in Bison output files without restriction.  We
made the decision because there were other tools comparable to Bison
which already permitted use for non-free programs.
</p></dd><div><br></div></div><div><br></div><div><br></div><div>On Jan 15, 2010, at 8:31 AM, Adam Radziszewski wrote:</div><br class="Apple-interchange-newline"><blockquote type="cite"><div>Dear corpora users,<br>we've got a formal problem with understanding of GPL licences when<br>applied to a morphological analyser and its output. I'm sure someone<br>before has dealt with a similar issue (and this may be of interest to<br>others as well), so I'm asking for help here.<br><br>Let's assume a morphological analyser is released under GPL. It<br>consists of an extensive lexicon (which in binary form is compiled to<br>a transducer) and the actual source code of the transducer and some<br>interface. The analyser reads plain text, tokenises it and outputs a<br>sequence of tokens with sets of tags attached (each word is assigned<br>its entry from the underlying lexicon).<br><br>The problem is: does the licence require that a corpus which is<br>obtained by running the analyser must be released under a similar<br>licence as well?<br><br>Why yes: source code is "the preferred form of the work for making<br>modifications to it [a work]" (<a href="http://www.gnu.org">www.gnu.org</a>), thus in case of such an<br>analyser, it should include the lexicon as well. What the analyser<br>actually does is to systematically dump parts of its lexicon (thus its<br>source code) and attach them to output. So the resulting corpus<br>actually contains parts of the source code of the analyser.<br><br>Why no: this situation resembles using the GNU compiler. When<br>compiling some code, gcc outputs some parts of its components to<br>generate the resulting object/binary. Yet nobody claims that any<br>output of gcc automatically becomes GPL'd.<br><br>Any ideas welcome.<br><br>Regards,<br>Adam Radziszewski<br>Wroc³aw University of Technology<br><br>_______________________________________________<br>Corpora mailing list<br><a href="mailto:Corpora@uib.no">Corpora@uib.no</a><br>http://mailman.uib.no/listinfo/corpora<br></div></blockquote></div><br></div></div></body></html>