<html><body style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space; ">Dear Chris,<div><br></div><div>as regards your question (i), you can find several frequency lists (for English, but also Italian and German) in this site:</div><div><br></div><div><a href="http://wacky.sslmit.unibo.it/">http://wacky.sslmit.unibo.it/</a> </div><div><br></div><div>The English lists were extracted from ukWaC, a very large web-derived corpus containing around 2 billion words, and are available for unigrams and bigrams. For further details please refer to the site, or have a look at:</div><p align="JUSTIFY" style="margin-bottom: 0cm">Baroni, Bernardini,
Ferraresi, Zanchetta (in print). <span lang="en-GB">"The
wacky wide web: a collection of very large linguistically processed
web-crawled corpora". </span><span lang="en-GB"><i>Language
resources and evaluation</i></span><span lang="en-GB">.</span></p>
<div>  </div><div>Regards,</div><div><br></div><div>Adriano</div><div><br></div><div><br><div><div>On 23-Feb-09, at 10:50 AM, <a href="mailto:CRuehlemann@aol.com">CRuehlemann@aol.com</a> wrote:</div><br class="Apple-interchange-newline"><blockquote type="cite"> <div id="role_body" style="FONT-SIZE: 10pt; COLOR: #000000; FONT-FAMILY: Arial" bottommargin="7" leftmargin="7" topmargin="7" rightmargin="7"><font id="role_document" face="Arial" color="#000000" size="2"> <div>  <div>Dear All</div> <div> </div> <div>I'm interested in two questions related to word frequency lists:</div> <div> </div> <div><strong>(i)</strong> The published frequency lists I am aware of include the following few:</div> <div><strong>BNC-based:</strong></div> <div><span>Kilgarriff, A.</span><font size="2"><span lang="EN-US" style="FONT-SIZE: 12pt; FONT-STYLE: normal; mso-bidi-font-size: 10.0pt; mso-ansi-language: EN-US; mso-bidi-font-style: italic"> <font size="2">(1998). ‘BNC database and word frequency lists</font></span><span lang="EN-US" style="mso-ansi-language: EN-US"><em>.</em></span><span lang="EN-US" style="FONT-STYLE: normal; mso-ansi-language: EN-US; mso-bidi-font-style: italic">’</span><span lang="EN-US" style="FONT-SIZE: 12pt; FONT-STYLE: normal; mso-bidi-font-size: 10.0pt; mso-ansi-language: EN-US; mso-bidi-font-style: italic"> </span><span lang="EN-GB" style="FONT-SIZE: 12pt; FONT-STYLE: normal; mso-bidi-font-size: 10.0pt; mso-ansi-language: EN-GB; mso-bidi-font-style: italic"><a title="http://www.kilgarriff.co.uk/bnc-readme.html" href="http://www.kilgarriff.co.uk/bnc-readme.html"><font color="#0000ff" size="2">http://www.kilgarriff.co.uk/bnc-readme.html</font></a></span></font></div> <div><span lang="EN-GB" style="FONT-SIZE: 12pt; FONT-STYLE: normal; mso-bidi-font-size: 10.0pt; mso-ansi-language: EN-GB; mso-bidi-font-style: italic"><font size="2"></font></span> </div> <div><span lang="EN-GB" style="FONT-SIZE: 12pt; FONT-STYLE: normal; mso-bidi-font-size: 10.0pt; mso-ansi-language: EN-GB; mso-bidi-font-style: italic"><font size="2">Leech, G., P. Rayson and A. Wilson. (2001). <em>Word Frequencies in Written and Spoken English: Based on the British National Corpus</em>. London: Longman</font></span></div> <div><span lang="EN-GB" style="FONT-SIZE: 12pt; FONT-STYLE: normal; mso-bidi-font-size: 10.0pt; mso-ansi-language: EN-GB; mso-bidi-font-style: italic"></span> </div> <div><span lang="EN-GB" style="FONT-SIZE: 12pt; FONT-STYLE: normal; mso-bidi-font-size: 10.0pt; mso-ansi-language: EN-GB; mso-bidi-font-style: italic"><font size="2"><strong>CIC-based:</strong></font></span></div> <div><span lang="EN-GB" style="FONT-SIZE: 12pt; FONT-STYLE: normal; mso-bidi-font-size: 10.0pt; mso-ansi-language: EN-GB; mso-bidi-font-style: italic"></span><font face="Times New Roman Baltic"><font size="2"><span lang="EN-GB" style="FONT-SIZE: 12pt; FONT-STYLE: normal; mso-bidi-font-size: 10.0pt; mso-ansi-language: EN-GB; mso-bidi-font-style: italic"><font face="Times New Roman"><font face="Arial"><font size="2"><span>McCarthy, M. J. (1998). </span><span lang="EN-US" style="FONT-SIZE: 12pt; COLOR: black; mso-bidi-font-size: 10.0pt; mso-ansi-language: EN-US"><em><font size="2">Spoken Language and Applied Linguistics.</font> </em></span></font></font><span lang="EN-US" style="FONT-SIZE: 12pt; COLOR: black; FONT-STYLE: normal; mso-bidi-font-size: 10.0pt; mso-ansi-language: EN-US"><font face="Arial" size="2">Cambridge: Cambridge University Press</font> </span></font></span></font></font></div> <div><font face="Times New Roman Baltic"><font size="2"><span lang="EN-GB" style="FONT-SIZE: 12pt; FONT-STYLE: normal; mso-bidi-font-size: 10.0pt; mso-ansi-language: EN-GB; mso-bidi-font-style: italic"><font face="Arial" size="2"><span lang="EN-US" style="FONT-SIZE: 12pt; COLOR: black; FONT-STYLE: normal; mso-bidi-font-size: 10.0pt; mso-ansi-language: EN-US"></span></font></span></font></font> </div> <div><font face="Times New Roman Baltic"><font size="2"><span lang="EN-GB" style="FONT-SIZE: 12pt; FONT-STYLE: normal; mso-bidi-font-size: 10.0pt; mso-ansi-language: EN-GB; mso-bidi-font-style: italic"><font size="+0"><span lang="EN-US" style="FONT-SIZE: 12pt; COLOR: black; FONT-STYLE: normal; mso-bidi-font-size: 10.0pt; mso-ansi-language: EN-US"><font face="Arial"><font size="2">Could anybody point me to more word frequency lists available either in print or on the internet?</font></font></span></font></span></font></font></div> <div><font face="Times New Roman Baltic"><font size="2"><span lang="EN-GB" style="FONT-SIZE: 12pt; FONT-STYLE: normal; mso-bidi-font-size: 10.0pt; mso-ansi-language: EN-GB; mso-bidi-font-style: italic"><font size="+0"><span lang="EN-US" style="FONT-SIZE: 12pt; COLOR: black; FONT-STYLE: normal; mso-bidi-font-size: 10.0pt; mso-ansi-language: EN-US"><font face="Arial"><font size="2"></font></font></span></font></span></font></font> </div> <div><font face="Times New Roman Baltic"><font size="2"><span lang="EN-GB" style="FONT-SIZE: 12pt; FONT-STYLE: normal; mso-bidi-font-size: 10.0pt; mso-ansi-language: EN-GB; mso-bidi-font-style: italic"><font size="+0"><span lang="EN-US" style="FONT-SIZE: 12pt; COLOR: black; FONT-STYLE: normal; mso-bidi-font-size: 10.0pt; mso-ansi-language: EN-US"><font face="Arial"><font size="2"><strong>(ii)</strong> As far as I know, the definite article <em>the</em> tops most word frequency lists derived from general corpora. Is anybody aware of any published in-depth discussion of this finding in terms of reference, be it anaphoric, cataphoric or deictic? </font></font></span></font></span></font></font></div> <div><font face="Times New Roman Baltic"><font size="2"><span lang="EN-GB" style="FONT-SIZE: 12pt; FONT-STYLE: normal; mso-bidi-font-size: 10.0pt; mso-ansi-language: EN-GB; mso-bidi-font-style: italic"><font size="+0"><span lang="EN-US" style="FONT-SIZE: 12pt; COLOR: black; FONT-STYLE: normal; mso-bidi-font-size: 10.0pt; mso-ansi-language: EN-US"><font face="Arial"><font size="2"></font></font></span></font></span></font></font> </div> <div><font face="Times New Roman Baltic"><font size="2"><span lang="EN-GB" style="FONT-SIZE: 12pt; FONT-STYLE: normal; mso-bidi-font-size: 10.0pt; mso-ansi-language: EN-GB; mso-bidi-font-style: italic"><font size="+0"><span lang="EN-US" style="FONT-SIZE: 12pt; COLOR: black; FONT-STYLE: normal; mso-bidi-font-size: 10.0pt; mso-ansi-language: EN-US"><font face="Arial"><font size="2">Any help is greatly appreciated. A summary will be posted.</font></font></span></font></span></font></font></div> <div><font face="Times New Roman Baltic"><font size="2"><span lang="EN-GB" style="FONT-SIZE: 12pt; FONT-STYLE: normal; mso-bidi-font-size: 10.0pt; mso-ansi-language: EN-GB; mso-bidi-font-style: italic"><font size="+0"><span lang="EN-US" style="FONT-SIZE: 12pt; COLOR: black; FONT-STYLE: normal; mso-bidi-font-size: 10.0pt; mso-ansi-language: EN-US"><font face="Arial"><font size="2"></font></font></span></font></span></font></font> </div> <div><font face="Times New Roman Baltic"><font size="2"><span lang="EN-GB" style="FONT-SIZE: 12pt; FONT-STYLE: normal; mso-bidi-font-size: 10.0pt; mso-ansi-language: EN-GB; mso-bidi-font-style: italic"><font size="+0"><span lang="EN-US" style="FONT-SIZE: 12pt; COLOR: black; FONT-STYLE: normal; mso-bidi-font-size: 10.0pt; mso-ansi-language: EN-US"><font face="Arial"><font size="2">Chris</font></font></span></font></span></font></font><font face="Times New Roman Baltic"><font size="2"><span lang="EN-GB" style="FONT-SIZE: 12pt; FONT-STYLE: normal; mso-bidi-font-size: 10.0pt; mso-ansi-language: EN-GB; mso-bidi-font-style: italic"></span></font></font></div><font face="Times New Roman Baltic"><font size="2"></font></font> <div> </div></div></font></div> _______________________________________________<br>Corpora mailing list<br><a href="mailto:Corpora@uib.no">Corpora@uib.no</a><br>http://mailman.uib.no/listinfo/corpora<br></blockquote></div><br></div></body></html>