<span class="Apple-style-span" style="font-family: arial, sans-serif; font-size: 13px; border-collapse: collapse; ">Muhammad Shakir Aziz,</span><div><font class="Apple-style-span" face="arial, sans-serif"><span class="Apple-style-span" style="border-collapse: collapse;"><br>

</span></font></div><div><font class="Apple-style-span" face="arial, sans-serif"><span class="Apple-style-span" style="border-collapse: collapse;">the null hypothesis-testing you discuss here doesn't work in corpus linguistics - for the argument see</span></font></div>

<div><font class="Apple-style-span" face="arial, sans-serif"><span class="Apple-style-span" style="border-collapse: collapse;"><span class="Apple-style-span" style="border-collapse: separate; font-family: 'Times New Roman'; font-size: medium; "><a href="http://kilgarriff.co.uk/Publications/2005-K-lineer.pdf">Language is never ever ever random.</a></span><span class="Apple-style-span" style="border-collapse: separate; font-family: 'Times New Roman'; font-size: medium; "> 2005 </span><span class="Apple-style-span" style="border-collapse: separate; font-family: 'Times New Roman'; font-size: medium; "><em>Corpus Linguistics and Linguistic Theory</em></span><span class="Apple-style-span" style="border-collapse: separate; font-family: 'Times New Roman'; font-size: medium; "> </span><span class="Apple-style-span" style="border-collapse: separate; font-family: 'Times New Roman'; font-size: medium; ">1 (2): 263-276.</span></span></font></div>

<div><font class="Apple-style-span" face="arial, sans-serif"><span class="Apple-style-span" style="border-collapse: collapse;"><font class="Apple-style-span" face="'Times New Roman'"><span class="Apple-style-span" style="border-collapse: separate; font-size: medium;"><br>

</span></font></span></font></div><div><font class="Apple-style-span" face="arial, sans-serif"><span class="Apple-style-span" style="border-collapse: collapse;"><font class="Apple-style-span" face="'Times New Roman'"><span class="Apple-style-span" style="border-collapse: separate; font-size: medium;">My rule of thumb is: it only counts if the ratio (of normalised frequencies) is greater than/less than a factor of two between two text types</span></font></span></font></div>

<div><font class="Apple-style-span" face="arial, sans-serif"><span class="Apple-style-span" style="border-collapse: collapse;"><font class="Apple-style-span" face="'Times New Roman'"><span class="Apple-style-span" style="border-collapse: separate; font-size: medium;"><br>

</span></font></span></font></div><div><font class="Apple-style-span" face="arial, sans-serif"><span class="Apple-style-span" style="border-collapse: collapse;"><font class="Apple-style-span" face="'Times New Roman'"><span class="Apple-style-span" style="border-collapse: separate; font-size: medium;">Regards</span></font></span></font></div>

<div><font class="Apple-style-span" face="arial, sans-serif"><span class="Apple-style-span" style="border-collapse: collapse;"><font class="Apple-style-span" face="'Times New Roman'"><span class="Apple-style-span" style="border-collapse: separate; font-size: medium;"><br>

</span></font></span></font></div><div><font class="Apple-style-span" face="arial, sans-serif"><span class="Apple-style-span" style="border-collapse: collapse;"><font class="Apple-style-span" face="'Times New Roman'"><span class="Apple-style-span" style="border-collapse: separate; font-size: medium;">Adam<br>

</span></font></span></font><br><div class="gmail_quote">On 28 June 2010 05:25, True Friend <span dir="ltr"><<a href="mailto:true.friend2004@gmail.com">true.friend2004@gmail.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex;">

<div dir="ltr">Good Day to All Copora Members<br>I am a masters in applied linguistics student, currently working on my thesis. The topic of research is the use of ditransitive constructions. To authenticate the results I want to apply statistical techniques on the research. For example I am trying to see whether there is a significant difference in the usage of two alternative ditransitive patterns in PWE (Pakistani Written English, the corpus I am working on for the research). The alternative ditransitive patterns here mean Double Object (He gave me a pen) and To Dative (He gave a pen to me). I am pasting the table here, which contains genre names and frequencies of all verbs (used ditransitively) in that genre.<br clear="all">



 <table style="border-collapse:collapse;width:144pt" border="0" cellpadding="0" cellspacing="0" width="192"><col style="width:48pt" span="3" width="64">
 <tbody><tr style="min-height:15pt" height="20">
  <td style="min-height:15pt;width:48pt" height="20" width="64">Genre</td>
  <td style="width:48pt" width="64">D. Object</td>
  <td style="width:48pt" width="64">To Dative</td>
 </tr>
 <tr style="min-height:15pt" height="20">
  <td style="min-height:15pt" height="20">ALT</td>
  <td align="right">0</td>
  <td align="right">4</td>
 </tr>
 <tr style="min-height:15pt" height="20">
  <td style="min-height:15pt" height="20">ART</td>
  <td align="right">210</td>
  <td align="right">344</td>
 </tr>
 <tr style="min-height:15pt" height="20">
  <td style="min-height:15pt" height="20">BKS</td>
  <td align="right">335</td>
  <td align="right">308</td>
 </tr>
 <tr style="min-height:15pt" height="20">
  <td style="min-height:15pt" height="20">BLT</td>
  <td align="right">2</td>
  <td align="right">7</td>
 </tr>
 <tr style="min-height:15pt" height="20">
  <td style="min-height:15pt" height="20">BRU</td>
  <td align="right">4</td>
  <td align="right">2</td>
 </tr>
 <tr style="min-height:15pt" height="20">
  <td style="min-height:15pt" height="20">CLM</td>
  <td align="right">108</td>
  <td align="right">303</td>
 </tr>
 <tr style="min-height:15pt" height="20">
  <td style="min-height:15pt" height="20">CST</td>
  <td align="right">0</td>
  <td align="right">7</td>
 </tr>
 <tr style="min-height:15pt" height="20">
  <td style="min-height:15pt" height="20">DIR</td>
  <td align="right">1</td>
  <td align="right">7</td>
 </tr>
 <tr style="min-height:15pt" height="20">
  <td style="min-height:15pt" height="20">EDT</td>
  <td align="right">8</td>
  <td align="right">32</td>
 </tr>
 <tr style="min-height:15pt" height="20">
  <td style="min-height:15pt" height="20">FTW</td>
  <td align="right">23</td>
  <td align="right">14</td>
 </tr>
 <tr style="min-height:15pt" height="20">
  <td style="min-height:15pt" height="20">INT</td>
  <td align="right">38</td>
  <td align="right">44</td>
 </tr>
 <tr style="min-height:15pt" height="20">
  <td style="min-height:15pt" height="20">LDS</td>
  <td align="right">7</td>
  <td align="right">53</td>
 </tr>
 <tr style="min-height:15pt" height="20">
  <td style="min-height:15pt" height="20">LTR</td>
  <td align="right">35</td>
  <td align="right">92</td>
 </tr>
 <tr style="min-height:15pt" height="20">
  <td style="min-height:15pt" height="20">MGP</td>
  <td align="right">2</td>
  <td align="right">5</td>
 </tr>
 <tr style="min-height:15pt" height="20">
  <td style="min-height:15pt" height="20">MNF</td>
  <td align="right">3</td>
  <td align="right">6</td>
 </tr>
 <tr style="min-height:15pt" height="20">
  <td style="min-height:15pt" height="20">MNU</td>
  <td align="right">0</td>
  <td align="right">1</td>
 </tr>
 <tr style="min-height:15pt" height="20">
  <td style="min-height:15pt" height="20">NLT</td>
  <td align="right">7</td>
  <td align="right">23</td>
 </tr>
 <tr style="min-height:15pt" height="20">
  <td style="min-height:15pt" height="20">NVL</td>
  <td align="right">5</td>
  <td align="right">3</td>
 </tr>
 <tr style="min-height:15pt" height="20">
  <td style="min-height:15pt" height="20">NWS</td>
  <td align="right">24</td>
  <td align="right">108</td>
 </tr>
 <tr style="min-height:15pt" height="20">
  <td style="min-height:15pt" height="20">OLT</td>
  <td align="right">44</td>
  <td align="right">9</td>
 </tr>
 <tr style="min-height:15pt" height="20">
  <td style="min-height:15pt" height="20">PLC</td>
  <td align="right">0</td>
  <td align="right">1</td>
 </tr>
 <tr style="min-height:15pt" height="20">
  <td style="min-height:15pt" height="20">PRS</td>
  <td align="right">11</td>
  <td align="right">22</td>
 </tr>
 <tr style="min-height:15pt" height="20">
  <td style="min-height:15pt" height="20">RPR</td>
  <td align="right">19</td>
  <td align="right">60</td>
 </tr>
 <tr style="min-height:15pt" height="20">
  <td style="min-height:15pt" height="20">RPT</td>
  <td align="right">4</td>
  <td align="right">17</td>
 </tr>
 <tr style="min-height:15pt" height="20">
  <td style="min-height:15pt" height="20">SRY</td>
  <td align="right">0</td>
  <td align="right">7</td>
 </tr>
 <tr style="min-height:15pt" height="20">
  <td style="min-height:15pt" height="20">STR</td>
  <td align="right">76</td>
  <td align="right">36</td>
 </tr>
 <tr style="min-height:15pt" height="20">
  <td style="min-height:15pt" height="20">THS</td>
  <td align="right">20</td>
  <td align="right">36</td>
 </tr>
 <tr style="min-height:15pt" height="20">
  <td style="min-height:15pt" height="20">TRN</td>
  <td align="right">30</td>
  <td align="right">19</td>
 </tr>
 <tr style="min-height:15pt" height="20">
  <td style="min-height:15pt" height="20">WWW</td>
  <td align="right">16</td>
  <td align="right">30</td>
 </tr>
</tbody></table>Some facts about the data are as follows:<br>Genre are not of equal in length (number of words) so there may be a genre like ALT of a few hundred words, and another like ART of .5 million words.<br>Frequencies here are calculated by adding the occurrences of all the verbs occurred in the given genre in a given pattern.<br>


I have applied Chi Square test using R and with this command "cxx = chisq.test(x, correct = FALSE)" (while 'x' and 'cxx' are R objects) and the result was as follows.<br>Pearson's Chi-squared test<br>


<br>data:  x <br>X-squared = 268.2688, df = 28, p-value < 2.2e-16<br><br>Going through the help manuals of R, I came to know that p-value  '2.2e-16' is a too much small number, so it means that the difference between the two variables (Double Object and To Dative) is significant, as p-value for social sciences is considered p<0.005. Please correct me if I am misunderstanding the test, its results or applying it incorrectly. And if this test is not suitable for such kind of analysis, and alternatively which kind of test should I apply. And last one last thing, I applied the test on normalized frequencies (which were calculated by dividing the frequency of each genre with the number of words it has, and the multiplying it with 100,000 i.e. .1 million) but the chisquare result was same (same p-value).<br>


Any help and comments would be highly appreciated.<br>Best Regards <br><br>-- <br>Muhammad Shakir Aziz محمد شاکر عزیز<br>Masters in Applied Linguistics (last semester student)<br>Translator, Course Developer, Linguist for Urdu, Punjabi and English<br>


Urdu:- <a href="http://awaz-e-dost.blogspot.com/" target="_blank">http://awaz-e-dost.blogspot.com/</a><br>English:- <a href="http://linguisticslearner.blogspot.com/" target="_blank">http://linguisticslearner.blogspot.com/</a><br>

Facebook:- <a href="http://www.facebook.com/truefriend2004" target="_blank">http://www.facebook.com/truefriend2004</a><br>
Skype:- true_friend2004<br>
</div>
<br>_______________________________________________<br>
Corpora mailing list<br>
<a href="mailto:Corpora@uib.no">Corpora@uib.no</a><br>
<a href="http://mailman.uib.no/listinfo/corpora" target="_blank">http://mailman.uib.no/listinfo/corpora</a><br>
<br></blockquote></div><br><br clear="all"><br>-- <br>================================================<br>Adam Kilgarriff                                      <a href="http://www.kilgarriff.co.uk">http://www.kilgarriff.co.uk</a>              <br>

Lexical Computing Ltd                   <a href="http://www.sketchengine.co.uk">http://www.sketchengine.co.uk</a><br>Lexicography MasterClass Ltd      <a href="http://www.lexmasterclass.com">http://www.lexmasterclass.com</a><br>

Universities of Leeds and Sussex       <a href="mailto:adam@lexmasterclass.com">adam@lexmasterclass.com</a><br>================================================<br>
</div>