Hi Andrea,<br><br>you could consider deWaC, a 1.7 billion word general-language corpus constructed from the<br>Web. From there you can easily obtain a token frequency list, that you could use as reference for your purposes. 
<br><br>For further info visit <a href="http://wacky.sslmit.unibo.it/" target="_blank" onclick="return top.js.OpenExtLink(window,event,this)">http://wacky.sslmit.unibo.it/</a> (in the "Available corpora" section you can find instructions on how to obtain the corpus).
<br><br>Regards,<br><br>Adriano<br><br><br><div><span class="gmail_quote">2008/1/8, Andrea Mulloni <<a href="mailto:andrea2@wlv.ac.uk" target="_blank" onclick="return top.js.OpenExtLink(window,event,this)">andrea2@wlv.ac.uk
</a>>:</span><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
<div>
Dear all,<div><br></div><div>I am currently looking for a German document and token frequency list to use as a reference. The original corpus from where the lists are taken could actually be of any size > 1 M tokens. Can anyone help me with any pointer?
</div><div><br></div><div>Thanks in advance for any suggestion,</div><div><br></div><div>Andrea</div><div><br><br><div> <span style="border-collapse: separate; color: rgb(0, 0, 0); font-family: Helvetica; font-size: 12px; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: normal; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px;">

<div><div style="margin: 0px;">-------------</div><div style="margin: 0px; min-height: 14px;"><br></div><div style="margin: 0px;">Andrea Mulloni</div><div style="margin: 0px;">PT_PhD_S (Part-Time PhD Student)</div><div style="margin: 0px;">

Computational Linguistics Group</div><div style="margin: 0px;">University of Wolverhampton</div><div style="margin: 0px;">Wolverhampton</div><div style="margin: 0px;">United Kingdom</div></div><div><br></div></span><br> 
</div>
<br></div></div><br>_______________________________________________<br>Corpora mailing list<br><a href="mailto:Corpora@uib.no" target="_blank" onclick="return top.js.OpenExtLink(window,event,this)">Corpora@uib.no</a><br>
<a href="http://mailman.uib.no/listinfo/corpora" target="_blank" onclick="return top.js.OpenExtLink(window,event,this)">
http://mailman.uib.no/listinfo/corpora</a><br><br></blockquote></div><br>