<html><body style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space; ">
There is related work about the ambiguity of grammars induced from treebanks. Anna Corazza, Alberto Lavelli, and Giorgio Satta used conditional cross entropy for that. This may help to at least abstract away from the parser :)<div><br class="webkit-block-placeholder"></div><div>Sandra<br><div><br class="webkit-block-placeholder"></div><div><br><div><div>On Feb 4, 2008, at 5:21 PM, Miles Osborne wrote:</div><br class="Apple-interchange-newline"><blockquote type="cite">Chris Brew suggested I actually explain what it is I meant:  here is a sample paper on phase transitions in solving problems like 3-sat:<br><br><a href="http://www.sciencemag.org/cgi/content/abstract/264/5163/1297">http://www.sciencemag.org/cgi/content/abstract/264/5163/1297</a><br> <br>Props to Chris!<br><br>Miles<br><br><div><span class="gmail_quote">On 04/02/2008, <b class="gmail_sendername">Miles Osborne</b> <<a href="mailto:miles@inf.ed.ac.uk">miles@inf.ed.ac.uk</a>> wrote:</span><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;"> I must confess, the idea that a corpus can be described in terms of "parseability" sounds a little ill-founded to me.  The choice of particular parsing algorithm may dictate which examples are hard to process, as will the underlying grammar etc etc.  <br> <br>What would be interesting (read:  hard) would be to look at the work on phase transitions in 3-sat problems and the like.  So, are there underlying graph-related characteristics of parsing which make certain sentences intrinsically hard to process and in particular can these characteristics be framed in a manner that was independent of the actual parser.   <br> <br>Miles<br clear="all"><span class="sg"> <br>-- <br>The University of Edinburgh is a charitable body, registered in Scotland, with registration number SC005336. </span></blockquote></div><br><br clear="all"><br>-- <br>The University of Edinburgh is a charitable body, registered in Scotland, with registration number SC005336. <div style="margin-top: 0px; margin-right: 0px; margin-bottom: 0px; margin-left: 0px; ">_______________________________________________</div><div style="margin-top: 0px; margin-right: 0px; margin-bottom: 0px; margin-left: 0px; ">Corpora mailing list</div><div style="margin-top: 0px; margin-right: 0px; margin-bottom: 0px; margin-left: 0px; "><a href="mailto:Corpora@uib.no">Corpora@uib.no</a></div><div style="margin-top: 0px; margin-right: 0px; margin-bottom: 0px; margin-left: 0px; "><a href="http://mailman.uib.no/listinfo/corpora">http://mailman.uib.no/listinfo/corpora</a></div> </blockquote></div><br><div> <span class="Apple-style-span" style="border-collapse: separate; border-spacing: 0px 0px; color: rgb(0, 0, 0); font-family: Helvetica; font-size: 12px; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: normal; text-align: auto; -khtml-text-decorations-in-effect: none; text-indent: 0px; -apple-text-size-adjust: auto; text-transform: none; orphans: 2; white-space: normal; widows: 2; word-spacing: 0px; "><div>Sandra Kuebler</div><div>Indiana University</div><div>Department of Linguistics</div><div>Memorial Hall 322</div><div>1021 E. Third Street</div><div>Bloomington IN 47405</div><div>USA</div><div>phone: (812) 855-3268</div><div>fax: (812) 855-5363</div><div>email: <a href="mailto:skuebler@indiana.edu">skuebler@indiana.edu</a></div><div><br class="khtml-block-placeholder"></div><br class="Apple-interchange-newline"></span> </div><br></div></div></body></html>