<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
<html>
<head>
  <meta content="text/html;charset=ISO-8859-1" http-equiv="Content-Type">
</head>
<body bgcolor="#ffffff" text="#000000">
<div class="moz-text-html" lang="x-western">
<div align="center"><b>*  New LDC Online Membership!  *</b><br>
<br>
LDC2005S26<br>
<b>*  <a
 href="http://www.ldc.upenn.edu/Catalog/CatalogEntry.jsp?catalogId=LDC2005S26">CSLU: 
22 Languages Corpus</a>  *</b><br>
<br>
LDC2005T34<br>
<b>*  <a
 href="http://www.ldc.upenn.edu/Catalog/CatalogEntry.jsp?catalogId=LDC2005T34">Chinese
<-> English Name Entity Lists (v1.0)</a>  *</b><br>
<br>
LDC2005S30<br>
<b>*  <a
 href="http://www.ldc.upenn.edu/Catalog/CatalogEntry.jsp?catalogId=LDC2005S30">The
West Point Company G3 American English Speech Data Corpus</a>  *<br>
</b><br>
</div>
<div align="center"><br>
The Linguistic Data Consortium (LDC) would
like to announce a new
membership option, the LDC Online Membership, and provide information
regarding our new publications.<br>
<br>
<hr size="2" width="100%"><br>
</div>
<div align="center"><b>LDC Online Membership</b><br>
</div>
<br>
The Linguistic Data Consortium is pleased to announce the LDC Online
Membership, which is now available for the 2006 Membership year.  LDC
Online contains a continuously growing, indexed collection of Arabic,
Chinese and English newswire text, millions of words of English
telephone speech from the Switchboard and Fisher collections and the
American English Spoken Lexicon, as well as the full text of the Brown
corpus.  With LDC Online, users can search textual data and play audio
extracts for transcribed utterances on standard web browsers.  LDC will
continue to add new material to LDC Online, including Spanish, Arabic,
and Chinese conversational telephone data in 2006.<br>
 <br>
The LDC Online Membership is a reduced cost alternative providing
interactive access to a growing subset of LDC data to users who do not
have a need for linguistic data on media.  Current LDC members already
have access to all LDC Online resources. The LDC Online Membership is
available to Non-Profit and U.S. government organizations for $1,000
(USD) per calendar year (January to December).  The obligations and
data usage restrictions of the LDC Online Membership are contained in
the <a
 href="http://www.ldc.upenn.edu/Membership/Agreements/LDCOnline.Agrmnt.new.htm">LDC
Online Membership Agreement</a>.<br>
<br>
We invite you to try LDC Online if you have not already done so. Please
go to <a class="moz-txt-link-freetext"
 href="http://online.ldc.upenn.edu">http://online.ldc.upenn.edu</a> for
a free, limited demonstration and
to sign up for a non-member LDC Online account.  To become an LDC
Online member or to request additional information, contact the LDC
Membership Department at <a class="moz-txt-link-abbreviated"
 href="mailto:ldc@ldc.upenn.edu">ldc@ldc.upenn.edu</a>.  <br>
<br>
We hope that the LDC Online Membership will enhance your linguistic
research and your association with the LDC.<br>
<br>
<div align="center"><br>
</div>
<b><br>
</b>
<div align="center"><b>New Publications<br>
</b><br>
<br>
</div>
(1) The <a
 href="http://www.ldc.upenn.edu/Catalog/CatalogEntry.jsp?catalogId=LDC2005S26">CSLU: 
22 Language Corpus</a> was produced by the Center for Spoken
Language Understanding at Oregon Health & Science University.  The
corpus consists of telephone speech from the following languages: 
Arabic, Cantonese, Czech, Farsi, German, Hindi, Hungarian, Japanese,
Korean, Malay, Mandarin, Italian, Polish, Portuguese, Russian, Spanish,
Swedish, Swahili, Tamil, Vietnamese, and English. The corpus contains
fixed vocabulary utterances (e.g. days of the week) as well as fluent
continuous speech. Each of the 50191 utterances is verified by a native
speaker to determine if the caller followed instructions when answering
the prompts. For this release, approximately 19758 utterances have
corresponding orthographic transcriptions.  <br>
<br>
<div align="center">*<br>
<br>
</div>
(2) <a
 href="http://www.ldc.upenn.edu/Catalog/CatalogEntry.jsp?catalogId=LDC2005T34">Chinese
<-> English Name Entity Lists (v1.0)</a> are compiled from
Xinhua News Agency articles. This release consists of 9 pairs of
bi-directional lists in the following categories: Person Names,  Place
Names, Organization Names, Industry Names, Press Names, Other Names,
and Who is Who Names. The English->Chinese version of each pair was
created by reversing the Chinese->English, both sorted by the Unix
built-in sort function.  <br>
<br>
<div align="center">*<br>
</div>
<br>
(3) The <a
 href="http://www.ldc.upenn.edu/Catalog/CatalogEntry.jsp?catalogId=LDC2005S30">West
Point Company G3 American English Speech Data Corpus</a> was
produced by Center for Technology Enhanced Language Learning, part of
the U.S. Military Academy's Department of Foreign Languages. During the
2000-2001 academic year, cadets, staff and faculty members at the
United States Military Academy volunteered to participate in a speech
data collection project for American English. The goal of the project
was to amass recordings from no less than one hundred adult speakers,
fifty males and fifty females, to form a substantial corpus of
high-quality read speech.<br>
<br>
The 185 sentences comprising the data collection script were written to
elicit examples of all or most all of the possible syllables used in
spoken American English.  The G3 Corpus audio data comes from 53 female
and 56 male volunteers, each of whom recorded approximately 104
utterances. The recordings are sampled at a 16 bit resolution, 22,050
samples per second. Recordings were made using headset microphones
(Shure M10) with preamplifiers attached to the line input jack of
desktop computers. The total amount of speech is about 15 hours.  <br>
<br>
<br>
<hr size="2" width="100%"><br>
<div align="center"><font face="Courier New"><small><big><font
 face="Times New Roman"><br>
If you need further
information, or would like to inquire about
membership to the LDC, please email <a class="moz-txt-link-abbreviated"
 href="mailto:ldc@ldc.upenn.edu">ldc@ldc.upenn.edu</a> or call +1 215
573 1275.</font></big><br>
<br>
<br>
</small></font></div>
<div align="center">--------------------------------------------------------------------<br>
</div>
<div align="center">
<pre class="moz-signature" cols="72">Linguistic Data Consortium                     Phone: (215) 573-1275
3600 Market Street                             Fax:   (215) 573-2175
Suite 810                                          <a
 class="moz-txt-link-abbreviated" href="mailto:ldc@ldc.upenn.edu">ldc@ldc.upenn.edu</a>
Philadelphia, PA 19104                      <a
 class="moz-txt-link-freetext" href="http://www.ldc.upenn.edu">http://www.ldc.upenn.edu</a></pre>
</div>
<pre class="moz-signature" cols="72">du
</pre>
</div>
</body>
</html>