A quick summary of the responses to my query about coreference annotation for the Penn TreeBank:<br><br>The ARRAU corpus:  <a href="http://cswww.essex.ac.uk/Research/nle/arrau/arrau-corpus-lrec2008">http://cswww.essex.ac.uk/Research/nle/arrau/arrau-corpus-lrec2008</a><br>
<br>The OntoNotes project:  <a href="http://www.ldc.upenn.edu/Catalog/CatalogEntry.jsp?catalogId=LDC2008T04">http://www.ldc.upenn.edu/Catalog/CatalogEntry.jsp?catalogId=LDC2008T04</a><br><br>The RST discourse treebank:  <a href="http://www.ldc.upenn.edu/Catalog/CatalogEntry.jsp?catalogId=LDC2002T07">http://www.ldc.upenn.edu/Catalog/CatalogEntry.jsp?catalogId=LDC2002T07</a><br>
<br>PEDT 1.0:  <a href="http://ufal.mff.cuni.cz/pedt">http://ufal.mff.cuni.cz/pedt</a>  (in progress)<br><br>Thanks to all who replied!<br><br>-Matt<br><br>On Mon, Feb 16, 2009 at 11:23 AM, Matthew Gerber <<a href="mailto:gerberm2@msu.edu">gerberm2@msu.edu</a>> wrote:<br>
><br>> Greetings,<br>>  <br>> I am looking for coreference annotation corpora based on the Penn TreeBank. I am aware of the BBN corpus:<br>>  <br>> <a href="http://www.ldc.upenn.edu/Catalog/CatalogEntry.jsp?catalogId=LDC2005T33">http://www.ldc.upenn.edu/Catalog/CatalogEntry.jsp?catalogId=LDC2005T33</a><br>
>  <br>> ...as well as the study by Poesio and Vieira ("A Corpus-based Investigation of Definite<br>> Description Use", 1998).<br>>  <br>> Is anyone aware of any other large-scale coreference annotation efforts for the Wall Street Journal portion of the Penn TreeBank?<br>
>  <br>> Cheers,<br>> Matt Gerber<br>> Michigan State University<br>