I partially agree with Geoffrey Sampson's points. It is certainly true that a table of numbers, in isolation, tells you nothing about the question you are asking, for the reasons that Professor Sampson gives. And statistical tests will not change this situation. To make progress, you need to be precise about what you intend to count as a  "spelling error". You could for example reframe the problem by as "how likely is it that the numbers that we observe are due to random mistakes in typing?", then proceed to make a mathematical model of typing errors. Or you could contrast the typing error hypothesis with an alternative hypothesis and frame the question as "Are the numbers that we observe more likely to be the result of typing errors or more likely to be due to the existence in the writing population of two groups of people, one of which always tries to spell the word one way, and one of which tries to spell it the other way". It will take some clear thinking to get this comparison right, because you have to make a precise quantitative judgement on things like the prior probability of finding groups that spell differently in the way we hypothesize. From experience of US/UK spelling differences, I believe that it would be a tricky and subtle matter to come up with suitably precise and useful hypotheses. No surprise there, as linguists we are used to working with challenging and complex data.<div>
<br></div><div>But, if you do manage to set up sufficiently precise hypotheses, and associate numbers with the hypotheses, statistical reasoning definitely can help. That's what it is for. This kind of thinking is the basis for all statistical tests that I am aware of. What you are never going to find is a statistical test that frees you from the necessity of making (or finding in the work of other scholars)  a precise and careful analysis of the problem you are trying to solve.  </div>
<div><br></div><div>Chris<br><br><div class="gmail_quote">On Wed, Jul 13, 2011 at 10:34 AM, Geoffrey Sampson <span dir="ltr"><<a href="mailto:grs2@sussex.ac.uk">grs2@sussex.ac.uk</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex;">
Dear Muhammad Shakir Aziz,<br>
<br>
I don't see that anyone else has responded to your query, so let me do so,<br>
rather late.  I would say that no kind of statistical test could possibly<br>
indicate whether variant spellings were errors, or allowable alternatives;<br>
because this question is not to do with numbers.  It is a question about<br>
where authority over the norms of the language you are concerned with is<br>
felt to lie, and what that authority says about orthography.  Some<br>
languages, at some periods, tolerate a wide variety of alternative<br>
spellings for given words, while other languages (or the same languages at<br>
other periods) may have extremely tightly-defined norms and strong social<br>
sanctions against violating them.  Carrying out statistical calculations on<br>
tables of the incidence of alternatives would not tell you anything about<br>
this, I believe.<br>
<br>
Geoffrey Sampson<br>
<br>
<br>
_______________________________________________<br>
UNSUBSCRIBE from this page: <a href="http://mailman.uib.no/options/corpora" target="_blank">http://mailman.uib.no/options/corpora</a><br>
Corpora mailing list<br>
<a href="mailto:Corpora@uib.no">Corpora@uib.no</a><br>
<a href="http://mailman.uib.no/listinfo/corpora" target="_blank">http://mailman.uib.no/listinfo/corpora</a><br>
</blockquote></div><br><br clear="all"><br>-- <br>Chris Brew, Ohio State University<br>
</div>