<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
<html>
<head>
  <meta content="text/html;charset=ISO-8859-1" http-equiv="Content-Type">
</head>
<body bgcolor="#ffffff" text="#000000">
<div class="moz-text-html" lang="x-western">
<div class="moz-text-html" lang="x-western">
<div class="moz-text-html" lang="x-western"> <br>
<div align="center"> LDC2006T06<br>
<b><a
 href="http://www.ldc.upenn.edu/Catalog/CatalogEntry.jsp?catalogId=LDC2006T06">ACE
2005 Multilingual Training Corpus</a><br>
</b><br>
LDC2006S29<b><br>
<a
 href="http://www.ldc.upenn.edu/Catalog/CatalogEntry.jsp?catalogId=LDC2006S29">Levantine
Arabic QT Training Data Set 5, Speech</a><br>
</b><br>
LDC2006T07<b><br>
<a
 href="http://www.ldc.upenn.edu/Catalog/CatalogEntry.jsp?catalogId=LDC2006T07">Levantine
Arabic QT Training Data Set 5, Transcripts</a><br>
<br>
</b><br>
<font face="Times New Roman, Times, serif">The Linguistic Data
Consortium (LDC) is pleased to announce the availability of three new
publications.<br>
<br>
</font>
<hr size="2" width="100%"></div>
<font face="Times New Roman, Times, serif"><b><br>
</b></font>
<div align="center"><font face="Times New Roman, Times, serif"><b>New
LDC Publications<br>
<br>
</b></font>
<div align="left"><font face="Times New Roman, Times, serif">(1) </font><a
 href="http://www.ldc.upenn.edu/Catalog/CatalogEntry.jsp?catalogId=LDC2006T06">ACE
2005 Multilingual Training Corpus</a> contains the complete set of
English, Arabic and Chinese training data for the 2005 Automatic
Content Extraction (ACE) technology evaluation. The corpus consists of
data of various types annotated for entities, relations and events and 
was
created by the Linguistic Data Consortium with support from the ACE
Program, with additional assistance from LDC.  The objective of the ACE
program is to develop automatic content extraction technology to
support automatic processing of human language in text form. </div>
</div>
<p>In November 2005, sites were evaluated on system performance in five
primary areas: the recognition of entities, values, temporal
expressions, relations, and events. Entity, relation and event mention
detection were also offered as diagnostic tasks. All tasks with the
exception of event tasks were performed for three languages, English,
Chinese and Arabic. Event tasks were evaluated in English and Chinese
only. The current publication comprises the official training data for
these evaluation tasks. </p>
<p>A complete description of the ACE 2005 Evaluation can be found on
the ACE Program website maintained by the <a
 href="http://www.nist.gov/speech/tests/ace/">National Institute of
Standards and Technology (NIST)</a>. </p>
<p>For more information about linguistic resources for the ACE Program,
including annotation guidelines, task definitions, free annotation
tools and other documentation, please visit LDC's <a
 href="http://projects.ldc.upenn.edu/ace/">ACE website.</a><b> </b> <b></b><br>
</p>
<p><br>
</p>
<p align="center">*<br>
</p>
<div align="left">
<p class="MsoNormal">(2) <a
 href="http://www.ldc.upenn.edu/Catalog/CatalogEntry.jsp?catalogId=LDC2006S29">Levantine
Arabic QT Training Data Set 5, Speech</a> and
(3) <a
 href="http://www.ldc.upenn.edu/Catalog/CatalogEntry.jsp?catalogId=LDC2006T07">Levantine
Arabic QT Training Data, Set 5, Transcripts</a> cover
1660 calls totaling approximately 250 hours of telephone conversation
in
Levantine Arabic collected between 2003 and 2005. These publications
are the
combination of four former training data sets: LDC2004E21 and
LDC2004E22,
LDC2004E65 and LDC2004E66, LDC2005S07 and LDC2005T03, and LDC2005S14
(Speech
and Transcripts). The participants represent a range of Levantine
Arabic
dialects. More than half of the speakers are Lebanese; among the other
speakers
are Jordanian, Palestinian and Syrian participants.<span style="">         
</span></p>
<p class="MsoNormal"><o:p><br>
</o:p><br>
</p>
</div>
<hr size="2" width="100%"><br>
<div align="center"><font face="Courier New"><small><big><font
 face="Times New Roman">If
you need further
information, or would like to inquire about
membership to the LDC, please email <a class="moz-txt-link-abbreviated"
 href="mailto:ldc@ldc.upenn.edu">ldc@ldc.upenn.edu</a> or call +1 215
573 1275.</font></big></small></font><br>
</div>
<p><font face="Courier New"><small><br>
<br>
</small></font>
</p>
<div align="center">--------------------------------------------------------------------<br>
</div>
<div align="center">
<pre class="moz-signature" cols="72">Linguistic Data Consortium                     Phone: (215) 573-1275
University of Pennsylvania                       Fax: (215) 573-2175
3600 Market St., Suite 810                         <a
 class="moz-txt-link-abbreviated" href="mailto:ldc@ldc.upenn.edu">ldc@ldc.upenn.edu</a>
Philadelphia, PA 19104 USA                  <a
 class="moz-txt-link-freetext" href="http://www.ldc.upenn.edu">http://www.ldc.upenn.edu</a></pre>
</div>
</div>
</div>
</div>
</body>
</html>