Hi Ciarán,<br><br><div class="gmail_quote">On 16 January 2012 16:07, Ciarán Ó Duibhín <span dir="ltr"><<a href="mailto:ciaran@oduibhin.freeserve.co.uk" target="_blank">ciaran@oduibhin.freeserve.co.uk</a>></span> wrote:<br>

<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<u></u>





<div bgcolor="#ffffff">
<div><font face="Arial">Are there any lemmatized corpora of German, which 
can be used queried on-line or on Windows?  I'm trying 
to lemmatize some German text myself for lexical purposes, and I would like 
to see how others have handled the problems, and how well it works.</font></div></div></blockquote><div><br>You might want to have a look at the DWDS corpora: <a href="http://www.dwds.de/" target="_blank">http://www.dwds.de/</a>. <br>
</div>
<blockquote class="gmail_quote" style="margin:0pt 0pt 0pt 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div bgcolor="#ffffff">
<div><font face="Arial"></font> </div>
<div><font face="Arial">Of the German corpora I have found, Negra is 
POS-tagged but not lemmatized, while Tiger is both POS-tagged and 
lemmatized.  Negra does not mention any query</font><font face="Arial"> facility; Tiger had one which is no longer supported and 
unfortunately doesn't work for me.  </font></div></div></blockquote><div><br>TIGERSearch is still available:<br><a href="http://www.wolfganglezius.de/doku.php?id=cl:tigersearch" target="_blank">http://www.wolfganglezius.de/doku.php?id=cl:tigersearch</a><br>


(there is also a link to a new version for Mac)<br><br>TIGERRegistry, which comes with TIGERSearch, allows you to import the Negra corpus and other formats.<br><br>The latest releases of TüBa-D/Z are also lemmatized (but also use STTS):<br>


<a href="http://www.sfs.uni-tuebingen.de/en/tuebadz.shtml" target="_blank">http://www.sfs.uni-tuebingen.de/en/tuebadz.shtml</a><br><br>As to the decomposition of compound words, SMOR by Helmut Schmid <a href="http://www.ims.uni-stuttgart.de/%7Eschmid/" target="_blank">http://www.ims.uni-stuttgart.de/~schmid/</a> would provide this (I'm not sure about the release conditions though).<br>


<br>Best,<br>Heike<br><br></div><br></div>-- <br>***********************************<br>Dr. Heike Zinsmeister<br><font><font face="arial,helvetica,sans-serif"><br>Department of Computer Science, University of Toronto<br>



Toronto, Ontario, CANADA  M5S 3G4<br><i>Office:</i> Room 386, D.L. Pratt Bldg, 6 King's College Road</font></font><br>&<br>Department of Linguistics, University of Konstanz, Box 185   <br>D-78457 Konstanz, GERMANY<br>


<br>Web:  <a href="http://ling.uni-konstanz.de/page/home/zinsmeister" target="_blank">http://ling.uni-konstanz.de/page/home/zinsmeister</a><br>