<div dir="ltr"><div>Hello,</div><div> </div><div>Sorry for what may be a novice-level CL/stats question:</div><div> </div><div>I'm interested in getting the association strength between particular words and specific patterns in three sub-corpora (e.g., NOUNS that occur in the pattern <em>the </em>N <em>of</em>). </div>
<div> </div><div>Attempting to follow methods in publications, I wanted to do this by applying a Fischer Exact test within each sub-corpus. I can then observe how strongly these words associate with the patterns in rank order within each corpus. </div>
<div> </div><div>But what can I do next to find out if the word/pattern associations are stronger or weaker in one sub-corpus compared to the other sub-corpora? Is it just a matter of visually observing differences in the p log values in each corpus or is there a statistical test I could do to show the degree to which the corpora differ in word/pattern strength? </div>
<div> </div><div>Thanks in advance for your thoughts!</div><div>Brian</div></div>