<html><head></head><body style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space; "><div>The ARTFL project at the University of Chicago has loaded up the Perseus texts in their PhiloLogic corpus-analysis package: here are the frequencies for the New Testament (warning: big pageload):</div><div><br></div><div><a href="http://perseus.uchicago.edu/cgi-bin/philologic/getwordcount.pl?GreekFeb2011.255.1">http://perseus.uchicago.edu/cgi-bin/philologic/getwordcount.pl?GreekFeb2011.255.1</a></div><div><br></div><div>Helma Dik's blog post at</div><div><a href="http://cybergreek.uchicago.edu/index.html/?q=node/26">http://cybergreek.uchicago.edu/index.html/?q=node/26</a></div><div>has links to several frequency lists for Greek prose, but they all focus on high-frequency words. I munged the URL query string to get you a list of just the hapax legomena:</div><div><a href="http://bit.ly/h88GbZ">http://bit.ly/h88GbZ</a> (also a big pageload)</div><div><br></div><div>Tricks:</div><div>• Setting the &displaymorethan=0&displaylessthan=2 made it show nothing, I guess because 0 is taken as "don't do this". I made it displaymorethan=0.5 and that persuaded it to show the hapax.</div><div>• Dr. Dik's query is only for prose and excludes a bunch of pre- post-classical authors; if you want a pan-Hellenic/pan-genre search you may wish to modify the query.</div><div><br></div><div>You can also get collocations out of this system, but I don't think that makes much sense for hapax legomena (although it might be interesting to see if there are words that co-occur with many hapax).</div><div><br></div><div>Enjoy,</div><div><br></div><div>Orion</div><br><div><div>On Mar 3, 2011, at 4:23 AM, Eric Atwell wrote:</div><br class="Apple-interchange-newline"><blockquote type="cite"><div>Graham,<br><br>The Perseus project at Tufts University has a growing collection of<br>classical texts, see:<br><br><a href="http://www.perseus.tufts.edu/hopper/collection?collection=Perseus:collection:Greco-Roman">http://www.perseus.tufts.edu/hopper/collection?collection=Perseus:collection:Greco-Roman</a><br><br>- this includes "New Testament. Brooke Foss Westcott, Fenton John<br>  Anthony Hort. (Greek)" - with a search facility<br>http://www.perseus.tufts.edu/hopper/search?doc=Perseus%3atext%3a1999.01.0155<br><br>... but i don't know if the website includes word frequencty lists,<br>you could try ghe help center<br>http://www.perseus.tufts.edu/hopper/help<br><br>or if that fails, email the webmaster<br><br>If you find the wordlist, please let me know :-)<br><br><br>eric atwell, Leeds University<br><br><br><br>On Wed, 2 Mar 2011, Graham White wrote:<br><br><blockquote type="cite">I wonder if anyone could point me in the direction of some information<br></blockquote><blockquote type="cite">I'm looking for. What I would like is word frequencies for New Testament<br></blockquote><blockquote type="cite">Greek, together with word frequencies for a larger corpus including the<br></blockquote><blockquote type="cite">New Testament (the TLG would be great): what I'm particularly interested<br></blockquote><blockquote type="cite">in is how many hapax legomena in the NT remain hapax legomena<br></blockquote><blockquote type="cite">in the larger corpus. (I'm doing this for a historical article I'm<br></blockquote><blockquote type="cite">writing, on Schleiermacher, hence the preference for the New Testament).<br></blockquote><blockquote type="cite"><br></blockquote><blockquote type="cite">Thanks<br></blockquote><blockquote type="cite"><br></blockquote><blockquote type="cite">Graham<br></blockquote><blockquote type="cite"><br></blockquote><blockquote type="cite">--------------------------------------<br></blockquote><blockquote type="cite"><br></blockquote><blockquote type="cite">Graham White<br></blockquote><blockquote type="cite">Electronic Engineering and Computer Science<br></blockquote><blockquote type="cite">Queen Mary University of London<br></blockquote><blockquote type="cite"><br></blockquote><blockquote type="cite">_______________________________________________<br></blockquote><blockquote type="cite">Corpora mailing list<br></blockquote><blockquote type="cite">Corpora@uib.no<br></blockquote><blockquote type="cite">http://mailman.uib.no/listinfo/corpora<br></blockquote><blockquote type="cite"><br></blockquote><br>-- <br>Eric Atwell, Senior Lecturer, Language research group,<br> I-AIBS Institute for Artificial Intelligence and Biological Systems<br> School of Computing, Faculty of Engineering, UNIVERSITY OF LEEDS<br> Leeds LS2 9JT, England.        TEL: 0113-3435430  FAX: 0113-3435468<br><br>_______________________________________________<br>Corpora mailing list<br>Corpora@uib.no<br>http://mailman.uib.no/listinfo/corpora<br></div></blockquote></div><br></body></html>