[ First, an apology. Due to technological incompetence, I have apparently inviting ALL subscribers to LinkedIn to be my contacts.  Aaargh. Be warned -- it's easily done! There must be some very surprised subscribers out there.]<br>
<br>The purpose of this posting  is to draw attention to the need to correlate arguments when doing or using corpus pattern analysis. <br><br>With colleagues at RIILP (if funded), I'm planning to develop a system for 
corpus tagging of lexical items in verb arguments with their 
semantic type, i.e. "populating" the CPA empirical ontology with nouns 
and noun phrases. This can be based in part on preparatory work that
 was done last year by Martin Holub in Prague. <br>
<br>Are semantic types alone sufficient for disambiguation?  No! They 
are more relevant than thematic roles, but they are only part of the 
story -- not sufficient, because patterns need to be identified as a 
whole, with correlation of arguments.  Here's an example I came across 
last week:<br>


<br>
                  PDEV PATTERN throw a party = organize a social gathering<br>
<br>
No problem with that. But then I discovered that, using the Sketch Engine, I had (carelessly) <u>globally</u>
 tagged all occurrences of throw+party with this pattern. So, on 
re-visiting 'throw', in among the party throwers I found sentences like:<br>





<br>
                   Recent events have thrown the Party into disarray,<br>
<br>
where the reference is to a political party, not a social gathering. 
This is an example of a fairly common kind of error in doing CPA, no 
doubt due to an excessively zealous desire to achieve quantity and 
speed.  
More haste, less speed! This means that, while most CPA patterns are 
well supported by corpus evidence, there is a need for systematic 
validation 
before they can be released as a gold standard for NLP applications. <br>
<br>
One thing that computational linguists might infer from this is that 
unambiguous identification of a meaning often depends crucially on <b><u>correlation</u></b> of arguments within a pattern -- what Ken Church and I 20 years ago called "triangulation".<br>




<br>There are of course some cases where the semantic type of the direct object alone is sufficient, e.g.:<br><br><div style="margin-left: 40px;">execute a person vs. execute an order.<br></div><br>but
 this is true only of a minority of verbs.  Patterns must be taken as a 
whole.  Thematic roles are all very well in their way, but they don't 
get us very far down the road towards message understanding. And it is a
 source of confusion to call them "semantic roles".  There is a huge 
difference between A) thematic roles such as "Agent", "Patient", 
Beneficiary", "Instrument" and B) semantic types such as [[Human]], 
[[Physical Object]], [[Weapon]]. Semantic types denote intrinsic 
semantic properties.  Thematic roles don't. <br>
<br>
Comments/feedback welcome. <br><br><br>