<div>I was working on my PhD when the BofE underwent a massive change (from 350m to 429 m), and still have data files from both versions. The interesting thing was that it wasn't a mere expansion, but some text disappeared while new ones were added. I didn't really do anything about it at the time - just took advantage of the fact that there were more concordance lines to use (in phraseology, there is always a paucity of data so it's nice to get more). But some frequencies got skewed massively - I was working on colour words, and have the data still (in an appendix to my PhD if anyone can't live without knowing ...<a href="http://amsacta.cib.unibo.it/archive/00002266/01/Thesis.pdf">http://amsacta.cib.unibo.it/archive/00002266/01/Thesis.pdf</a> ) which shows how the frequency of colour lemmas changed.<br>
But I suppose that monitoring langauge presumably also means re-assessing which text types and sources should be included and in which proportions. I would hope there's a lot of email/blog-type language in there now, but, alas, I no longer have access to the beast (too expensive), so am not at liberty to know. What I do know is that, having recently re-analysed a number of phrases using BNC data, and compared them to the analyses done on BofE data, I feel utterly confused as the results I've got are more different than they should be (I too find BNC more homogeneous than BofE).</div>

<div>just a little food for thought</div>
<div>Gill</div>
<div> </div>
<div> </div>
<div><span class="gmail_quote">On 23/09/2009, <b class="gmail_sendername">Mark Davies</b> <<a href="mailto:Mark_Davies@byu.edu">Mark_Davies@byu.edu</a>> wrote:</span>
<blockquote class="gmail_quote" style="PADDING-LEFT: 1ex; MARGIN: 0px 0px 0px 0.8ex; BORDER-LEFT: #ccc 1px solid">Brett T. wrote:<br><br>>> Without wishing to trojan horse this discussion, you may like to know that the recently revamped version of WordbanksOnline, that of course evolved from the boe, are available at present on a free trial basis: <a href="http://www.collinslanguage.com/wordbanks/Default.aspx">www.collinslanguage.com/wordbanks/Default.aspx</a><br>
<br>I think it address the question perfectly. Thanks for your input, Brett.<br><br>Bill L. wrote:<br><br>>> I hope that the word bank is a step forward.<br>>> The word WORD indicates that it may not be. Frege tried to wean us off single words more than 100 years ago.<br>
>> Only COLLOCATION makes them FACTS<br>>> I am sure that if your registered users feel sold short by the new software they will let the list know.<br><br>I've been using the Bank of English via Word Banks Online for the last couple of weeks. Although I do have questions about the corpus design (for diachronic work), what I really do like about the BoE in its most recent incarnation as WBO is the interface. It is based on the Sketch Engine architecture and interface, which does a wonderful job with collocates and collocations. I would strongly recommend to anyone here who is mainly interested in collocates and collocations that they take a look at BoE/WBO online -- especially if they aren't already familiar with Sketch Engine and what it has to offer (and no, I'm not on their payroll :-).<br>
<br>And not unpredictably (here it comes, Adam) I might mention that you might also want to take a look at the COCA corpus (<a href="http://www.americancorpus.org">www.americancorpus.org</a>) -- very similar to Sketch Engine in terms of queries (collocates, etc), large genre-balanced corpus, and freely available online.<br>
<br>Mark D.<br><br>============================================<br>Mark Davies<br>Professor of (Corpus) Linguistics<br>Brigham Young University<br>(phone) 801-422-9168 / (fax) 801-422-0906<br>Web: <a href="http://davies-linguistics.byu.edu">http://davies-linguistics.byu.edu</a><br>
<br>** Corpus design and use // Linguistic databases **<br>** Historical linguistics // Language variation **<br>** English, Spanish, and Portuguese **<br>============================================<br>_______________________________________________<br>
Corpora mailing list<br><a href="mailto:Corpora@uib.no">Corpora@uib.no</a><br><a href="http://mailman.uib.no/listinfo/corpora">http://mailman.uib.no/listinfo/corpora</a><br></blockquote></div><br><br clear="all"><br>-- <br>
*********************************<br>Dr. Gill Philip<br>CILTA<br>Università degli Studi di Bologna<br>Piazza San Giovanni in Monte, 4<br>40124 Bologna<br>Italy