<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
<html>
<head>
  <meta content="text/html;charset=ISO-8859-1" http-equiv="Content-Type">
  <title></title>
</head>
<body bgcolor="#ffffff" text="#000000">
<p align="center"><b><font face="Times New Roman, Times, serif">*  <a
 href="https://online.ldc.upenn.edu/login.html">New LDC
Online Services</a><a href="https://online.ldc.upenn.edu/login.html">!</a> 
*</font></b></p>
<p align="center"><font face="Times New Roman, Times, serif">LDC2005T09<b><br>
</b><b>*  <a
 href="http://www.ldc.upenn.edu/Catalog/CatalogEntry.jsp?catalogId=LDC2005T09">ACE
2004 Multilingual Training Corpus</a>  *<br>
</b><br>
LDC2005T06<b><br>
    *  <a
 href="http://www.ldc.upenn.edu/Catalog/CatalogEntry.jsp?catalogId=LDC2005T06">Chinese
News Translation Text Part 1</a>  *<br>
</b></font></p>
<p align="center"><font face="Times New Roman, Times, serif">LDC2005T08<b><br>
*  <a
 href="http://www.ldc.upenn.edu/Catalog/CatalogEntry.jsp?catalogId=LDC2005T08">Discourse
Graphbank</a>  *<br>
<br>
</b></font></p>
<p align="center">The LDC would like to
announce the availability of a new LDC Online service and the release
of three new corpora.<br>
<br>
</p>
<hr size="2" width="100%">
<o:p></o:p><br>
The
LDC is pleased to announce that an improved LDC Online service is now
available.<span style="">  </span>LDC Online can be accessed at the
following
url:<br>
<p class="MsoNormal" align="center" style="text-align: center;"><a
 href="https://online.ldc.upenn.edu/">https://online.ldc.upenn.edu/login.html</a></p>
<p class="MsoNormal" style=""><o:p></o:p>Organizations
that hold 2005 Membership in the LDC will be able to perform text
searches on
our entire English Gigaword corpus.<span style="">  </span>This
corpus is a comprehensive archive of newswire text data that has been
acquired
over several years by the LDC.<span style="">  </span>Current
members will also be able to access the American English Spoken Lexicon
(AESL).<span style="">  </span>AESL contains pronunciations in
individual audio files for more than 50,000 of the most common words in
English<o:p></o:p></p>
<p class="MsoNormal" style=""><o:p></o:p>Even if your organization is
not a current member, you can access LDC Online through a guest
account.  As
a guest, an LDC online user will be able to access the American
English
Spoken Lexicon.<o:p></o:p></p>
<p class="MsoNormal"><o:p></o:p>We will offer periodic updates to LDC
Online to include new
corpora and search functions.  Please check in with us often as we
anticipate this will be an exciting offering.<br>
<br>
</p>
<hr size="2" width="100%"><br>
<font face="Times New Roman, Times, serif"><a
 href="http://www.ldc.upenn.edu/Catalog/CatalogEntry.jsp?catalogId=LDC2005T09">ACE
2004 Multilingual Training Corpus</a> contains the complete set of
English, Arabic and
Chinese training data for the 2004 Automatic Content Extraction (ACE)
technology evaluation. The objective of the ACE program is to develop
automatic content
extraction technology to support automatic processing of human language
in text form.  <br>
<br>
Sites were evaluated on system
performance in six areas: Entity Detection and Recognition (EDR),
Entity Mention Detection (EMD), EDR Co-reference, Relation Detection
and Recognition (RDR), Relation Mention Detection (RMD), and RDR given
reference entities. All tasks were evaluated in three languages:
English, Chinese and Arabic.</font><font
 face="Times New Roman, Times, serif"><br>
</font><big><font face="Times New Roman, Times, serif"><small><br>
<br>
</small></font></big>
<div align="center"><big><font face="Times New Roman, Times, serif"><small>*<br>
<br>
</small></font></big>
<div align="left"><font face="Times New Roman, Times, serif"><a
 href="http://www.ldc.upenn.edu/Catalog/CatalogEntry.jsp?catalogId=LDC2005T06">Chinese
News Translation Text Part 1</a> supports the development of automatic
machine translation systems,
the LDC was sponsored to solicit English translations for a single set
of Chinese source materials. </font></div>
</div>
<p><font face="Times New Roman, Times, serif">The source Chinese text
and its English translations were selected
and translated in different LDC projects.  A total of about 474K
Chinese
characters were selected from two sources, namely Xinhua and AFP, and
translation services were provided by seven translation agencies. Each
Chinese news story was translated once.  <br>
</font></p>
<div align="center"><big><font face="Times New Roman, Times, serif"><small>*<br>
<br>
</small></font></big></div>
<font face="Times New Roman, Times, serif"><a
 href="http://www.ldc.upenn.edu/Catalog/CatalogEntry.jsp?catalogId=LDC2005T08">Discourse
Treebank</a> aims to define a descriptively adequate data structure for
representing discourse coherence structures.. This project also
investigates the impact of discourse coherence structures on other
linguistic processes and natural language applications (e.g. anaphor
resolution,summarization, information retrieval), to develop and
test discourse parsing algorithms.  The data consists of 135 texts from
AP Newswire and Wall Street
Journal, annotated with coherence relations. The source for data is 
TIPSTER Complete (LDC93T3A).  </font>
<pre class="moz-signature" cols="72"><small>
</small></pre>
<div align="center">
<hr size="2" width="100%"><small><br>
<br>
<font face="Courier New"><small><big><font
 face="Times New Roman, Times, serif"><big>If you need further
information, or would like to inquire about membership to the LDC,
please email <a class="moz-txt-link-abbreviated"
 href="mailto:ldc@ldc.upenn.edu">ldc@ldc.upenn.edu</a> or call +1 215
573 2175.</big></font></big></small></font></small><br>
</div>
<div align="center"><br>
</div>
<div align="left"><big>
</big>
<pre class="moz-signature" cols="72"><big><font
 face="Times New Roman, Times, serif">                     Linguistic Data Consortium                     Phone: (215) 573-1275
                        University of Pennsylvania                         Fax:   (215) 573-2175
                        3600 Market St., Suite 810                           <a
 class="moz-txt-link-abbreviated" href="mailto:ldc@ldc.upenn.edu">ldc@ldc.upenn.edu</a>
                        Philadelphia, PA 19104                       <a
 class="moz-txt-link-freetext" href="http://www.ldc.upenn.edu"> http://www.ldc.upenn.edu</a></font></big></pre>
</div>
<pre class="moz-signature" cols="72">

</pre>
</body>
</html>