<div dir="ltr">Good Day to All Copora Members<br>I am a masters in applied linguistics student, currently working on my thesis. The topic of research is the use of ditransitive constructions. To authenticate the results I want to apply statistical techniques on the research. For example I am trying to see whether there is a significant difference in the usage of two alternative ditransitive patterns in PWE (Pakistani Written English, the corpus I am working on for the research). The alternative ditransitive patterns here mean Double Object (He gave me a pen) and To Dative (He gave a pen to me). I am pasting the table here, which contains genre names and frequencies of all verbs (used ditransitively) in that genre.<br clear="all">

 <table style="border-collapse: collapse; width: 144pt;" border="0" cellpadding="0" cellspacing="0" width="192"><col style="width: 48pt;" span="3" width="64">
 <tbody><tr style="height: 15pt;" height="20">
  <td style="height: 15pt; width: 48pt;" height="20" width="64">Genre</td>
  <td style="width: 48pt;" width="64">D. Object</td>
  <td style="width: 48pt;" width="64">To Dative</td>
 </tr>
 <tr style="height: 15pt;" height="20">
  <td style="height: 15pt;" height="20">ALT</td>
  <td align="right">0</td>
  <td align="right">4</td>
 </tr>
 <tr style="height: 15pt;" height="20">
  <td style="height: 15pt;" height="20">ART</td>
  <td align="right">210</td>
  <td align="right">344</td>
 </tr>
 <tr style="height: 15pt;" height="20">
  <td style="height: 15pt;" height="20">BKS</td>
  <td align="right">335</td>
  <td align="right">308</td>
 </tr>
 <tr style="height: 15pt;" height="20">
  <td style="height: 15pt;" height="20">BLT</td>
  <td align="right">2</td>
  <td align="right">7</td>
 </tr>
 <tr style="height: 15pt;" height="20">
  <td style="height: 15pt;" height="20">BRU</td>
  <td align="right">4</td>
  <td align="right">2</td>
 </tr>
 <tr style="height: 15pt;" height="20">
  <td style="height: 15pt;" height="20">CLM</td>
  <td align="right">108</td>
  <td align="right">303</td>
 </tr>
 <tr style="height: 15pt;" height="20">
  <td style="height: 15pt;" height="20">CST</td>
  <td align="right">0</td>
  <td align="right">7</td>
 </tr>
 <tr style="height: 15pt;" height="20">
  <td style="height: 15pt;" height="20">DIR</td>
  <td align="right">1</td>
  <td align="right">7</td>
 </tr>
 <tr style="height: 15pt;" height="20">
  <td style="height: 15pt;" height="20">EDT</td>
  <td align="right">8</td>
  <td align="right">32</td>
 </tr>
 <tr style="height: 15pt;" height="20">
  <td style="height: 15pt;" height="20">FTW</td>
  <td align="right">23</td>
  <td align="right">14</td>
 </tr>
 <tr style="height: 15pt;" height="20">
  <td style="height: 15pt;" height="20">INT</td>
  <td align="right">38</td>
  <td align="right">44</td>
 </tr>
 <tr style="height: 15pt;" height="20">
  <td style="height: 15pt;" height="20">LDS</td>
  <td align="right">7</td>
  <td align="right">53</td>
 </tr>
 <tr style="height: 15pt;" height="20">
  <td style="height: 15pt;" height="20">LTR</td>
  <td align="right">35</td>
  <td align="right">92</td>
 </tr>
 <tr style="height: 15pt;" height="20">
  <td style="height: 15pt;" height="20">MGP</td>
  <td align="right">2</td>
  <td align="right">5</td>
 </tr>
 <tr style="height: 15pt;" height="20">
  <td style="height: 15pt;" height="20">MNF</td>
  <td align="right">3</td>
  <td align="right">6</td>
 </tr>
 <tr style="height: 15pt;" height="20">
  <td style="height: 15pt;" height="20">MNU</td>
  <td align="right">0</td>
  <td align="right">1</td>
 </tr>
 <tr style="height: 15pt;" height="20">
  <td style="height: 15pt;" height="20">NLT</td>
  <td align="right">7</td>
  <td align="right">23</td>
 </tr>
 <tr style="height: 15pt;" height="20">
  <td style="height: 15pt;" height="20">NVL</td>
  <td align="right">5</td>
  <td align="right">3</td>
 </tr>
 <tr style="height: 15pt;" height="20">
  <td style="height: 15pt;" height="20">NWS</td>
  <td align="right">24</td>
  <td align="right">108</td>
 </tr>
 <tr style="height: 15pt;" height="20">
  <td style="height: 15pt;" height="20">OLT</td>
  <td align="right">44</td>
  <td align="right">9</td>
 </tr>
 <tr style="height: 15pt;" height="20">
  <td style="height: 15pt;" height="20">PLC</td>
  <td align="right">0</td>
  <td align="right">1</td>
 </tr>
 <tr style="height: 15pt;" height="20">
  <td style="height: 15pt;" height="20">PRS</td>
  <td align="right">11</td>
  <td align="right">22</td>
 </tr>
 <tr style="height: 15pt;" height="20">
  <td style="height: 15pt;" height="20">RPR</td>
  <td align="right">19</td>
  <td align="right">60</td>
 </tr>
 <tr style="height: 15pt;" height="20">
  <td style="height: 15pt;" height="20">RPT</td>
  <td align="right">4</td>
  <td align="right">17</td>
 </tr>
 <tr style="height: 15pt;" height="20">
  <td style="height: 15pt;" height="20">SRY</td>
  <td align="right">0</td>
  <td align="right">7</td>
 </tr>
 <tr style="height: 15pt;" height="20">
  <td style="height: 15pt;" height="20">STR</td>
  <td align="right">76</td>
  <td align="right">36</td>
 </tr>
 <tr style="height: 15pt;" height="20">
  <td style="height: 15pt;" height="20">THS</td>
  <td align="right">20</td>
  <td align="right">36</td>
 </tr>
 <tr style="height: 15pt;" height="20">
  <td style="height: 15pt;" height="20">TRN</td>
  <td align="right">30</td>
  <td align="right">19</td>
 </tr>
 <tr style="height: 15pt;" height="20">
  <td style="height: 15pt;" height="20">WWW</td>
  <td align="right">16</td>
  <td align="right">30</td>
 </tr>
</tbody></table>Some facts about the data are as follows:<br>Genre are not of equal in length (number of words) so there may be a genre like ALT of a few hundred words, and another like ART of .5 million words.<br>Frequencies here are calculated by adding the occurrences of all the verbs occurred in the given genre in a given pattern.<br>
I have applied Chi Square test using R and with this command "cxx = chisq.test(x, correct = FALSE)" (while 'x' and 'cxx' are R objects) and the result was as follows.<br>Pearson's Chi-squared test<br>
<br>data:  x <br>X-squared = 268.2688, df = 28, p-value < 2.2e-16<br><br>Going through the help manuals of R, I came to know that p-value  '2.2e-16' is a too much small number, so it means that the difference between the two variables (Double Object and To Dative) is significant, as p-value for social sciences is considered p<0.005. Please correct me if I am misunderstanding the test, its results or applying it incorrectly. And if this test is not suitable for such kind of analysis, and alternatively which kind of test should I apply. And last one last thing, I applied the test on normalized frequencies (which were calculated by dividing the frequency of each genre with the number of words it has, and the multiplying it with 100,000 i.e. .1 million) but the chisquare result was same (same p-value).<br>
Any help and comments would be highly appreciated.<br>Best Regards <br><br>-- <br>Muhammad Shakir Aziz محمد شاکر عزیز<br>Masters in Applied Linguistics (last semester student)<br>Translator, Course Developer, Linguist for Urdu, Punjabi and English<br>
Urdu:- <a href="http://awaz-e-dost.blogspot.com/">http://awaz-e-dost.blogspot.com/</a><br>English:- <a href="http://linguisticslearner.blogspot.com/">http://linguisticslearner.blogspot.com/</a><br>Facebook:- <a href="http://www.facebook.com/truefriend2004">http://www.facebook.com/truefriend2004</a><br>
Skype:- true_friend2004<br>
</div>