<!doctype html public "-//W3C//DTD W3 HTML//EN">
<html><head><style type="text/css"><!--
blockquote, dl, ul, ol, li { padding-top: 0 ; padding-bottom: 0 }
 --></style><title>Re: [Corpora-List] Syntax search problem
resolved</title></head><body>
<div>At 6:24 AM -0700 6/16/06, Linda Bawcom wrote:</div>
<blockquote type="cite" cite>Dear friends, collegues, and list
members,</blockquote>
<blockquote type="cite" cite> </blockquote>
<blockquote type="cite" cite>Thanks to Knut Hofland, Geoffrey
Williams, Chris Tribble and Mark Davis, who all very kindly
took me by the hand, I was able to find the strings I needed by
using, WITH the BNC:</blockquote>
<blockquote type="cite" cite> </blockquote>
<blockquote type="cite" cite><w NP0>* <w PRF>of ,
although I was unable to get strings with <w NP0>* <w
PRF>of  <w NP0>* Well, It all seems quite obvious and
logical now of course!</blockquote>
<blockquote type="cite" cite> </blockquote>
<blockquote type="cite" cite> And  since nouns follow<i>
of</i> then it's just a matter of deleting items such
as United States of America (no pun intended)  or Port of
Spain. I'm not quite sure whether to include items such as Joan of
Arc, Lawrence of Arabia or Prince of Wales when basically I'm looking
for frequency of i.e. Clinton of Little Rock. I suppose I'll check
with John Sinclair-the 'of' expert!</blockquote>
<blockquote type="cite" cite> </blockquote>
<blockquote type="cite" cite>Kindest regards,</blockquote>
<blockquote type="cite" cite>Linda</blockquote>
<blockquote type="cite" cite> </blockquote>
<div><br></div>
<div>Dear Linda,</div>
<div>I just ran a query for "NP0 of NP0" in BNCweb (CQP
edition) and got 7850 hits. The frequency list feature gives you the
following top 50 combinations:</div>
<div><br></div>
<div>No.<x-tab>     </x-tab>Lexical item(s)<x-tab>
</x-tab>No. of occurrences<x-tab>     
</x-tab>Percent<br>
1<x-tab>        </x-tab>Isle of
Man<x-tab>    
</x-tab>346<x-tab>     </x-tab>4.41%<br>
2<x-tab>  </x-tab>Isle of Wight<x-tab>  
</x-tab>342<x-tab>     </x-tab>4.36%<br>
3<x-tab>  </x-tab>States of
America<x-tab>      
</x-tab>168<x-tab>     </x-tab>2.14%<br>
4<x-tab>  </x-tab>End of London<x-tab>  
</x-tab>97<x-tab>      </x-tab>1.24%<br>
5<x-tab>  </x-tab>Donaldson of Lymington<x-tab> 
</x-tab>73<x-tab>      </x-tab>0.93%<br>
6<x-tab>  </x-tab>Isle of Dogs<x-tab>   
</x-tab>55<x-tab>      </x-tab>0.7%<br>
7<x-tab>   </x-tab>Bridge of
Harwich<x-tab>      
</x-tab>50<x-tab>      </x-tab>0.64%<br>
8<x-tab>  </x-tab>Riding of Yorkshire<x-tab>    
</x-tab>46<x-tab>      </x-tab>0.59%<br>
9<x-tab>  </x-tab>Jesus of
Nazareth<x-tab>      
</x-tab>44<x-tab>      </x-tab>0.56%<br>
10<x-tab> </x-tab>John of Gaunt<x-tab>  
</x-tab>43<x-tab>      </x-tab>0.55%<br>
11<x-tab> </x-tab>Mitterrand of France<x-tab>   
</x-tab>38<x-tab>      </x-tab>0.48%<br>
12<x-tab> </x-tab>Joan of Arc<x-tab>    
</x-tab>35<x-tab>      </x-tab>0.45%<br>
13<x-tab> </x-tab>Goff of
Chieveley<x-tab>      
</x-tab>34<x-tab>      </x-tab>0.43%<br>
14<x-tab> </x-tab>Keith of Kinkel<x-tab>
</x-tab>32<x-tab>      </x-tab>0.41%<br>
15<x-tab> </x-tab>William of Malmesbury<x-tab>  
</x-tab>29<x-tab>      </x-tab>0.37%<br>
16<x-tab> </x-tab>Francis of
Assisi<x-tab>      
</x-tab>29<x-tab>      </x-tab>0.37%<br>
17<x-tab> </x-tab>HUSSEIN of
Jordan<x-tab>      
</x-tab>27<x-tab>      </x-tab>0.34%<br>
18<x-tab> </x-tab>Lawrence of Arabia<x-tab>     
</x-tab>27<x-tab>      </x-tab>0.34%<br>
19<x-tab> </x-tab>Richard of Gloucester<x-tab>  
</x-tab>26<x-tab>      </x-tab>0.33%<br>
20<x-tab> </x-tab>States of
Europe<x-tab>       
</x-tab>26<x-tab>      </x-tab>0.33%<br>
21<x-tab> </x-tab>Highlands of Scotland<x-tab>  
</x-tab>26<x-tab>      </x-tab>0.33%<br>
22<x-tab> </x-tab>Port of Spain<x-tab>  
</x-tab>26<x-tab>      </x-tab>0.33%<br>
23<x-tab> </x-tab>Slynn of Hadley<x-tab>
</x-tab>24<x-tab>      </x-tab>0.31%<br>
24<x-tab> </x-tab>Kingdom of
Great<x-tab>       
</x-tab>23<x-tab>      </x-tab>0.29%<br>
25<x-tab> </x-tab>Isle of Skye<x-tab>   
</x-tab>21<x-tab>      </x-tab>0.27%<br>
26<x-tab> </x-tab>Isle of Lewis<x-tab>  
</x-tab>20<x-tab>      </x-tab>0.25%<br>
27<x-tab> </x-tab>John of
Salisbury<x-tab>      
</x-tab>19<x-tab>      </x-tab>0.24%<br>
28<x-tab> </x-tab>Joseph of Arimathea<x-tab>    
</x-tab>18<x-tab>      </x-tab>0.23%<br>
29<x-tab> </x-tab>Edward of
England<x-tab>      
</x-tab>18<x-tab>      </x-tab>0.23%<br>
30<x-tab> </x-tab>Michael of Kent<x-tab>
</x-tab>18<x-tab>      </x-tab>0.23%<br>
31<x-tab> </x-tab>Hassan of
Morocco<x-tab>      
</x-tab>18<x-tab>      </x-tab>0.23%<br>
32<x-tab> </x-tab>Julian of
Norwich<x-tab>      
</x-tab>18<x-tab>      </x-tab>0.23%<br>
33<x-tab> </x-tab>HUGH OF LINCOLN<x-tab>
</x-tab>18<x-tab>      </x-tab>0.23%<br>
34<x-tab> </x-tab>Florence of Worcester<x-tab>  
</x-tab>18<x-tab>      </x-tab>0.23%<br>
35<x-tab> </x-tab>Philip of Spain<x-tab>
</x-tab>15<x-tab>      </x-tab>0.19%<br>
36<x-tab> </x-tab>Isle of Sheppey<x-tab>
</x-tab>15<x-tab>      </x-tab>0.19%<br>
37<x-tab> </x-tab>Eleanor of Aquitaine<x-tab>   
</x-tab>14<x-tab>      </x-tab>0.18%<br>
38<x-tab> </x-tab>Fahd of Saudi<x-tab>  
</x-tab>14<x-tab>      </x-tab>0.18%<br>
39<x-tab> </x-tab>Mubarak of
Egypt<x-tab>       
</x-tab>13<x-tab>      </x-tab>0.17%<br>
40<x-tab> </x-tab>John of God<x-tab>    
</x-tab>13<x-tab>      </x-tab>0.17%<br>
41<x-tab> </x-tab>Philip of
France<x-tab>       
</x-tab>12<x-tab>      </x-tab>0.15%<br>
42<x-tab> </x-tab>Teresa of Avila<x-tab>
</x-tab>12<x-tab>      </x-tab>0.15%<br>
43<x-tab> </x-tab>Hugh of Lyons<x-tab>  
</x-tab>12<x-tab>      </x-tab>0.15%<br>
44<x-tab> </x-tab>Hook of Holland<x-tab>
</x-tab>12<x-tab>      </x-tab>0.15%<br>
45<x-tab> </x-tab>Fraser of Carmyllie<x-tab>    
</x-tab>12<x-tab>      </x-tab>0.15%<br>
46<x-tab> </x-tab>William of Jumièges<x-tab>    
</x-tab>11<x-tab>      </x-tab>0.14%<br>
47<x-tab> </x-tab>Henry of Lancaster<x-tab>     
</x-tab>11<x-tab>      </x-tab>0.14%<br>
48<x-tab> </x-tab>Brandon of Oakbrook<x-tab>    
</x-tab>11<x-tab>      </x-tab>0.14%<br>
49<x-tab> </x-tab>Morris of Borth-y-Gest<x-tab> 
</x-tab>11<x-tab>      </x-tab>0.14%</div>
<div>50<x-tab>      </x-tab>Isle of
Innisfree<x-tab>      
</x-tab>11<x-tab>      </x-tab>0.14%</div>
<div><br></div>
<div>I can send you the complete list if you want. It may also be
useful to add a few optional elements to your retrieval pattern. For
example, you could allow sequences of items tagged as NP0 as well as
instances of NN1 and NN2 that immediately follow the second NP0 to get
instances like the following:</div>
<div><br></div>
<div><w NP0>Superintendent <w NP0>Trobridge <w
PRF>of <w NP0>Ealing <w NN2>Police <w
NN1>Station</div>
<div><br></div>
<div><w NP0>St <w NP0>Francis <w PRF>of <w
NP0>Assisi</div>
<div><br></div>
<div><w NP0>Archbishop <w NP0>MacNamara <w PRF>of
<w NP0>Dublin</div>
<div><br></div>
<div>Best,</div>
<div>Sebastian</div>
<div><br></div>
<x-sigsep><pre>-- 
</pre></x-sigsep>
<div><br>
Dr. Sebastian Hoffmann<br>
Englisches Seminar der Univ. Zürich<br>
Plattenstrasse 47<br>
CH-8032 Zürich<br>
Tel: +41-44-634 3551<br>
Fax: +41-44-634 4908<br>
http://www-es.unizh.ch</div>
</body>
</html>