<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
<html>
<head>
  <meta content="text/html;charset=ISO-8859-1" http-equiv="Content-Type">
  <title></title>
</head>
<body bgcolor="#ffffff" text="#000000">
<font face="Times New Roman, Times, serif"><big><small><br>
</small></big></font>
<div align="center"><font face="Times New Roman, Times, serif"><big><small>LDC2005S13</small></big></font><br>
<font face="Times New Roman, Times, serif"><big><a
 href="http://www.ldc.upenn.edu/Catalog/CatalogEntry.jsp?catalogId=LDC2005S13"><b><small>Fisher
English Training Part 2 Speech</small></b></a></big></font><br>
<br>
<font face="Times New Roman, Times, serif">LDC2005T19</font><br>
<font face="Times New Roman, Times, serif"><a
 href="http://www.ldc.upenn.edu/Catalog/CatalogEntry.jsp?catalogId=LDC2005T19"><b>Fisher
English Training Part 2 Transcripts</b></a></font><br>
<br>
LDC2005L01<br>
<a
 href="http://www.ldc.upenn.edu/Catalog/CatalogEntry.jsp?catalogId=LDC2005L01"><b>Mawukakan
Lexicon</b></a><br>
<br>
<b>
</b><br>
The Linguistic Data Consortium (LDC) is pleased to announce the
availability of three new corpora.<br>
</div>
<br>
<hr size="2" width="100%">
<p><br>
<a
 href="http://www.ldc.upenn.edu/Catalog/CatalogEntry.jsp?catalogId=LDC2005S13">Fisher
English Training Part 2 Speech</a> represents the second half of a
collection of conversational telephone speech (CTS) that was collected
at the LDC.  It contains 5849 audio files, each one containing a full
conversation of up to 10 minutes. Corresponding transcripts are
available as Fisher English Training Text Data, Part 2. </p>
<p>The individual audio files are presented in NIST SPHERE format, and
contain two-channel mu-law sample data; "shorten" compression has been
applied to all files.</p>
<p align="center"><font face="Times New Roman"><small><big>*<br>
</big></small></font></p>
<p><a
 href="http://www.ldc.upenn.edu/Catalog/CatalogEntry.jsp?catalogId=LDC2005T19">Fisher
English Training Part 2 Transcripts</a> contains the corresponding
transcripts for the Fisher English Training Part 2 Speech collection.
About 12% of the conversations were transcribed
at the LDC, and the rest were done by BBN and WordWave, using a
significantly different approach to the task.<span style="">  </span>A
central goal in both sets was to<br>
maximize the speed and economy of the transcription process, and this
in turn involved certain aspects of mark-up detail and quality control
that may have been common in previous, smaller corpora.  <br>
</p>
<div align="center"><font face="Times New Roman"><small><big>*</big></small></font><br>
</div>
<p> </p>
<p><a
 href="http://www.ldc.upenn.edu/Catalog/CatalogEntry.jsp?catalogId=LDC2005L01">Mawukakan
Lexicon</a> is the first publication of an on going project aiming to
build an Electronic Dictionary of four Mandekan (Eastern Manding
languages of the Mande Group of the Niger-Congo family).  The lack of
written tradition makes such a dictionary project extremely important.
Our expectation is that once this initial goal reached, it will become
easier to extend the dictionary to all the other varieties of Mandekan.</p>
<span style="font-size: 12pt; font-family: "Times New Roman";">The
lexicon is trilingual, that is, the
target language is Mawukakan, while English and French are used as
glossing
languages.</span>  Both the Toolbox and the XML versions of this
dictionary use the Unicode (UTF-8) encoding.  <font
 face="Times New Roman"><small><big><br>
</big></small></font><br>
<hr size="2" width="100%"><font face="Times New Roman"><br>
</font>
<div align="center"><font face="Courier New"><small><big><font
 face="Times New Roman">If you need further
information, or would like to inquire about
membership to the LDC, please email <a class="moz-txt-link-abbreviated"
 href="mailto:ldc@ldc.upenn.edu">ldc@ldc.upenn.edu</a> or call +1 215
573 2175.</font></big><br>
<br>
<br>
</small></font></div>
<div align="center">--------------------------------------------------------------------<br>
</div>
<div align="center">
<pre class="moz-signature" cols="72">Linguistic Data Consortium                     Phone: (215) 573-1275
3600 Market Street                             Fax:   (215) 573-2175
Suite 810                                          <a
 class="moz-txt-link-abbreviated" href="mailto:ldc@ldc.upenn.edu">ldc@ldc.upenn.edu</a>
Philadelphia, PA 19104                      <a
 class="moz-txt-link-freetext" href="http://www.ldc.upenn.edu">http://www.ldc.upenn.edu</a></pre>
</div>
<pre class="moz-signature" cols="72">
</pre>
</body>
</html>