<html xmlns:v="urn:schemas-microsoft-com:vml" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=us-ascii">
<meta name="Generator" content="Microsoft Word 12 (filtered medium)">
<style><!--
/* Font Definitions */
@font-face
        {font-family:Wingdings;
        panose-1:5 0 0 0 0 0 0 0 0 0;}
@font-face
        {font-family:Wingdings;
        panose-1:5 0 0 0 0 0 0 0 0 0;}
@font-face
        {font-family:Calibri;
        panose-1:2 15 5 2 2 2 4 3 2 4;}
@font-face
        {font-family:Consolas;
        panose-1:2 11 6 9 2 2 4 3 2 4;}
/* Style Definitions */
p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0cm;
        margin-bottom:.0001pt;
        font-size:11.0pt;
        font-family:"Calibri","sans-serif";}
a:link, span.MsoHyperlink
        {mso-style-priority:99;
        color:blue;
        text-decoration:underline;}
a:visited, span.MsoHyperlinkFollowed
        {mso-style-priority:99;
        color:purple;
        text-decoration:underline;}
p.MsoPlainText, li.MsoPlainText, div.MsoPlainText
        {mso-style-priority:99;
        mso-style-link:"Plain Text Char";
        margin:0cm;
        margin-bottom:.0001pt;
        font-size:10.5pt;
        font-family:Consolas;}
span.EmailStyle17
        {mso-style-type:personal-compose;
        font-family:"Calibri","sans-serif";
        color:windowtext;}
span.PlainTextChar
        {mso-style-name:"Plain Text Char";
        mso-style-priority:99;
        mso-style-link:"Plain Text";
        font-family:Consolas;}
.MsoChpDefault
        {mso-style-type:export-only;}
@page WordSection1
        {size:612.0pt 792.0pt;
        margin:72.0pt 72.0pt 72.0pt 72.0pt;}
div.WordSection1
        {page:WordSection1;}
--></style><!--[if gte mso 9]><xml>
<o:shapedefaults v:ext="edit" spidmax="1026" />
</xml><![endif]--><!--[if gte mso 9]><xml>
<o:shapelayout v:ext="edit">
<o:idmap v:ext="edit" data="1" />
</o:shapelayout></xml><![endif]-->
</head>
<body lang="EN-GB" link="blue" vlink="purple">
<div class="WordSection1">
<p class="MsoNormal">Now that the focus of the discussion has moved away from statistics to linguistics, and people<o:p></o:p></p>
<p class="MsoNormal">have started to question the hypothesis on which the original question was based, I feel more able to contribute…
<span style="font-family:Wingdings">J</span><o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">I agree with comments that mention diachronic aspects (vintage, language change), social aspects (variety, subgroup identity),<o:p></o:p></p>
<p class="MsoNormal">and researcher’s perspective/goal…<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Yorick:  the different frequencies of ceiling(/cieling) and piece(/peice) raises some interesting questions.<o:p></o:p></p>
<p class="MsoNormal">You did not reveal the Google figures you obtained, so I did a quick check:<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">"ceiling" About 223,000,000 results (0.20 seconds) = c. 99.7% [COCA: 11846; BYU-BNC: 2208]
<o:p></o:p></p>
<p class="MsoNormal">"cieling" About 738,000 results (0.13 seconds) = c. 0.03% [COCA: 4; BYU-BNC: 0]<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">"piece" About 1,290,000,000 results (0.11 seconds) = c. 99.2% [COCA: 45038; BYU-BNC: 9027]<o:p></o:p></p>
<p class="MsoNormal">"peice" About 10,800,000 results (0.13 seconds) = c. 0.08% [COCA: 3; BYU-BNC: 1]<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">a) to what extent does the higher frequency of piece : ceiling = c. 6:1 in Google (slightly less in COCA/BYU-BNC)<o:p></o:p></p>
<p class="MsoNormal">mean there are more opportunities for ‘error’ (of whatever type) in the spelling of ‘piece’?<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">b) the extremely low frequencies of cieling/peice  in COCA/BYU-BNC may represent cleanup/normalisation, or text-type restriction?<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">c) to what extent do people take more or less care over the spelling of a word the rarer it is (eg ceiling);
<o:p></o:p></p>
<p class="MsoNormal">are more educated/specialist writers involved in its use, as opposed to the total speech community?<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">d) the ‘correct’ spelling is the reverse in the 2 examples you chose; do the absolute/relative positions of<o:p></o:p></p>
<p class="MsoNormal">the characters on QWERTY keyboards, or mobile phone SMS keys, affect the occurrences?<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">e) which occurrences are ‘typos’, which are ‘errors’, and which are deliberate choices (eg ‘mentions’ rather than ‘uses’<o:p></o:p></p>
<p class="MsoNormal">in linguistic contexts like this posting or in classroom spelling correction exercises; or in humorous writing, etc)?<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">best<o:p></o:p></p>
<p class="MsoNormal">ramesh<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Ramesh Krishnamurthy<o:p></o:p></p>
<p class="MsoNormal">Visiting Academic Fellow, School of Languages and Social Sciences, Aston University, Birmingham B4 7ET<o:p></o:p></p>
<p class="MsoNormal">Room: NX01. Tel: 0121-204-3812. <br>
Director, ACORN (Aston Corpus Network project): <a href="http://acorn.aston.ac.uk/">
<span style="color:blue">http://acorn.aston.ac.uk/</span></a> <o:p></o:p></p>
<p class="MsoNormal">Project Investigator, GeWiss (Volkswagen Foundation) project:
<a href="http://www1.aston.ac.uk/lss/research/research-projects/gewiss-spoken-academic-discourse/">
<span style="color:blue">http://www1.aston.ac.uk/lss/research/research-projects/gewiss-spoken-academic-discourse/</span></a><o:p></o:p></p>
<p class="MsoNormal">------<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoPlainText">Date: Sat, 16 Jul 2011 17:06:30 +0100<o:p></o:p></p>
<p class="MsoPlainText">From: Yorick Wilks <Y.Wilks@dcs.shef.ac.uk><o:p></o:p></p>
<p class="MsoPlainText">Subject: Re: [Corpora-List] Which Statistical Test is Suitable<o:p></o:p></p>
<p class="MsoPlainText">To: Angus Grieve-Smith <grvsmth@panix.com><o:p></o:p></p>
<p class="MsoPlainText">Cc: corpora@uib.no<o:p></o:p></p>
<p class="MsoPlainText"><o:p> </o:p></p>
<p class="MsoPlainText">Im not sure if this contributes anything to the discussion or not, but there is clearly an obvious distinction between<o:p></o:p></p>
<p class="MsoPlainText">,on the one hand, acceptable variants in spelling, where the balance shifts over time, e.g. judgement/judgment (especially as that one is not a US/UK distinction, a quite separate issue), and, on the other, misspellings among which there
 is huge variation, even for seemingly similar "errors".<o:p></o:p></p>
<p class="MsoPlainText">For example if you compare on Google ceiling/cieling with piece/peice (where, importantly, the wrong versions are non-words in both cases) and where both seem to be "e/i reversal" you find that one error is a hundred times commoner than
 the other. Im not sure what that tells us about anything---such as mastery of explicit rules and their exceptions or not, as the case may be.<o:p></o:p></p>
<p class="MsoPlainText">Yorick Wilks<o:p></o:p></p>
<p class="MsoPlainText"><o:p> </o:p></p>
<p class="MsoPlainText">On 16 Jul 2011, at 15:51, Angus Grieve-Smith wrote:<o:p></o:p></p>
<p class="MsoPlainText"><o:p> </o:p></p>
<p class="MsoPlainText">> On 7/14/2011 3:36 AM, True Friend wrote:<o:p></o:p></p>
<p class="MsoPlainText">>> As you can see the frequencies are closely related, my aim was to summarize the group behaviour. The point here is to show the general public's usage, that despite of rules available, people are confused in spelling of these words.<o:p></o:p></p>
<p class="MsoPlainText">> <o:p></o:p></p>
<p class="MsoPlainText">>    It's rarely just a case of "people are confused."  Croft (2000) talks about cases where a single community uses two different variants.  He is referring primarily to morphological or syntactic variation, but I think this also applies
 to spelling variation.  There are three possible outcomes:<o:p></o:p></p>
<p class="MsoPlainText">> <o:p></o:p></p>
<p class="MsoPlainText">> 1. The alternative forms are reassigned to different functions so that they are no longer in competition.<o:p></o:p></p>
<p class="MsoPlainText">> 2. The variation is reinterpreted as corresponding to a division of the community.<o:p></o:p></p>
<p class="MsoPlainText">> 3. The community gradually shifts towards the use of one variant or the other.<o:p></o:p></p>
<p class="MsoPlainText">> <o:p></o:p></p>
<p class="MsoPlainText">>    It's still not clear to me what statement you're trying to make, who you're trying to convince, and what your ultimate political goal is.  Whose usage do they really care about?<o:p></o:p></p>
<p class="MsoPlainText">> <o:p></o:p></p>
<p class="MsoPlainText">> Croft, William. 2000. Explaining Language Change: An Evolutionary Approach. London: Longman.<o:p></o:p></p>
<p class="MsoPlainText">> <o:p></o:p></p>
<p class="MsoPlainText">> -- <o:p></o:p></p>
<p class="MsoPlainText">>                       -Angus B. Grieve-Smith<o:p></o:p></p>
<p class="MsoPlainText">>                       grvsmth@panix.com<o:p></o:p></p>
<p class="MsoPlainText"><o:p> </o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
</body>
</html>