Actually, I think you have misunderstood what I said:  this truly is about the data and not about "algorithms".  What I said was that you need to be able to understand about the hardness of the sentences themselves, without reference to the parser etc.  Read that sample paper and you will know what I mean.<br>
<br>Miles<br><br><div><span class="gmail_quote">On 05/02/2008, <b class="gmail_sendername">Adam Kilgarriff</b> <<a href="mailto:adam@lexmasterclass.com">adam@lexmasterclass.com</a>> wrote:</span><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
<div><span class="q"><span class="gmail_quote">On 04/02/2008, <b class="gmail_sendername">Miles Osborne</b> <<a href="mailto:miles@inf.ed.ac.uk" target="_blank" onclick="return top.js.OpenExtLink(window,event,this)">miles@inf.ed.ac.uk</a>> wrote:</span>
<blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0px 0px 0px 0.8ex; padding-left: 1ex;">I must confess, the idea that a corpus can be described in terms of "parseability" sounds a little ill-founded to me.  The choice of particular parsing algorithm may dictate which examples are hard to process, as will the underlying grammar etc etc.  </blockquote>


<div> </div></span>
<div>I couldn't disagree more.  It's the equivalent of saying that it's ill-founded to evaluate parsers because they will always perform differently on different corpora. It just goes to show that you're interested in algorithms not data.  The field is way imbalanced by people who think more about algorithms than the corpora they apply them to.</div>


<div> </div>
<div>Adam</div>
<div> </div><br>
<blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0px 0px 0px 0.8ex; padding-left: 1ex;">-- <br>================================================<br>Adam Kilgarriff                                      <a href="http://www.kilgarriff.co.uk" target="_blank" onclick="return top.js.OpenExtLink(window,event,this)">http://www.kilgarriff.co.uk</a>              <br>

Lexical Computing Ltd                   <a href="http://www.sketchengine.co.uk" target="_blank" onclick="return top.js.OpenExtLink(window,event,this)">http://www.sketchengine.co.uk</a><br>Lexicography MasterClass Ltd      <a href="http://www.lexmasterclass.com" target="_blank" onclick="return top.js.OpenExtLink(window,event,this)">http://www.lexmasterclass.com</a><br>

Universities of Leeds and Sussex       <a href="mailto:adam@lexmasterclass.com" target="_blank" onclick="return top.js.OpenExtLink(window,event,this)">adam@lexmasterclass.com</a><br>================================================ </blockquote>
</div>
</blockquote></div><br><br clear="all"><br>-- <br>The University of Edinburgh is a charitable body, registered in Scotland, with registration number SC005336.