<div dir="ltr"><div class="gmail_default" style="font-size:small">Dear all,<br><br></div><div class="gmail_default" style="font-size:small">Thank you all very much for those corpora.<br><br></div><div class="gmail_default" style="font-size:small">
Best regards,<br></div></div><div class="gmail_extra"><br><br><div class="gmail_quote">2013/12/12 Kathrin Beck <span dir="ltr"><<a href="mailto:kathrin.beck@uni-tuebingen.de" target="_blank">kathrin.beck@uni-tuebingen.de</a>></span><br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Dear Yoann,<br>
<br>
The TüBa-D/Z (Tübingen Treebank of Written German; <a href="http://www.sfs.uni-tuebingen.de/en/ascl/resources/corpora/tueba-dz.html" target="_blank">http://www.sfs.uni-tuebingen.de/en/ascl/resources/corpora/tueba-dz.html</a>) is a manually annotated treebank of approximately 85,000 sentences. It contains five subclasses of Named Entities; nested Named Entities are annotated as well:<br>

17,386 GPE (geo-political entities)<br>
5,380 LOC (locations)<br>
30,181 PER (persons)<br>
18,262 ORG (organisations)<br>
3,594 OTH (other, e.g. movie titles)<br>
<br>
Examples for the annotation scheme are: [PER Bill Clinton]; [ORG [GPE New York] Times]<br>
<br>
Kind regards,<br>
<br>
Kathrin Beck<br>
<br>
<br>
Am 09.12.2013 um 12:00 schrieb <a href="mailto:corpora-request@uib.no">corpora-request@uib.no</a>:<br>
<br>
> Message: 7<br>
> Date: Mon, 9 Dec 2013 11:29:54 +0100<br>
> From: Yoann Dupont <<a href="mailto:yoa.dupont@gmail.com">yoa.dupont@gmail.com</a>><br>
<div class="im">> Subject: [Corpora-List] Tree-Structured Named Entities corpora ?<br>
</div>> To: <a href="mailto:corpora@uib.no">corpora@uib.no</a><br>
<div class="im">><br>
> Greetings Corpora-List,<br>
><br>
> I am currently looking for corpora with tree-structured named entities.<br>
><br>
> A simple example of tree structuration would be a person which has a first<br>
> and last name : "Barack Obama" is a person whose first name is "Barack" and<br>
</div><div class="im">> last name is "Obama". A parsing would then be : *(PER (NAME.FIRST* Barack*)<br>
> (NAME.LAST* Obama*))*<br>
</div><div class="im">> Another example would be geographical addresses.<br>
><br>
> I know some corpora that could fit this definition : the SemEval'2007 task<br>
> 9 corpora (tree-structured NE in Spanish and Catalan) and the GENIA corpus<br>
> (tree-structured NE for biomedical entities in English).<br>
><br>
> Does any of you know other tree-structured NE corpora ?<br>
><br>
> Thank you kindly in advance,<br>
><br>
> --<br>
> Yoann DUPONT<br>
</div>> -------------- next part --------------<br>
> A non-text attachment was scrubbed...<br>
> Name: not available<br>
> Type: text/html<br>
> Size: 1523 bytes<br>
> Desc: not available<br>
> URL: <<a href="http://www.uib.no/mailman/public/corpora/attachments/20131209/66ca235f/attachment.txt" target="_blank">http://www.uib.no/mailman/public/corpora/attachments/20131209/66ca235f/attachment.txt</a>><br>

<br>
-----------------<br>
Kathrin Beck<br>
<br>
Project Administrator CLARIN-D<br>
Dept. of Computational Linguistics<br>
University of Tübingen<br>
Wilhelmstr. 19/ 2.22<br>
72074 Tübingen<br>
Germany<br>
<br>
Tel.: <a href="tel:%2B49-7071-29-73970" value="+4970712973970">+49-7071-29-73970</a><br>
Fax:  <a href="tel:%2B49-7071-29-5214" value="+497071295214">+49-7071-29-5214</a><br>
E-Mail: <a href="mailto:kbeck@sfs.uni-tuebingen.de">kbeck@sfs.uni-tuebingen.de</a>,<br>
<a href="mailto:kathrin.beck@uni-tuebingen.de">kathrin.beck@uni-tuebingen.de</a><br>
<div class="HOEnZb"><div class="h5"><br>
<br>
_______________________________________________<br>
UNSUBSCRIBE from this page: <a href="http://mailman.uib.no/options/corpora" target="_blank">http://mailman.uib.no/options/corpora</a><br>
Corpora mailing list<br>
<a href="mailto:Corpora@uib.no">Corpora@uib.no</a><br>
<a href="http://mailman.uib.no/listinfo/corpora" target="_blank">http://mailman.uib.no/listinfo/corpora</a><br>
</div></div></blockquote></div><br><br clear="all"><br>-- <br><font size="1">Yoann DUPONT</font><br>
</div>