<html><body style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space; "><div>                                   <font class="Apple-style-span" size="5"><span class="Apple-style-span" style="font-size: 18px;">Manually Annotated Sub-Corpus</span></font></div><div><font class="Apple-style-span" size="5"><span class="Apple-style-span" style="font-size: 18px;">                                 <a href="http://www.anc.org/MASC">http://www.anc.org/MASC</a></span></font></div><div><br></div><div>              *** All downloads available at <a href="http://www/anc.org/MASC/Download.html">http://www/anc.org/MASC/Download.html</a> ***</div><div>MASC1 (82K words with multiple layers of annotation) is also available from the Linguistic Data Consortium</div><div><br></div><div><b>MASC texts</b></div><div><b>--------------</b></div>The full 500K of MASC spoken and written texts are now available for download from the MASC website.<div>The corpus comprises roughly 25K words from each of 20 different genres:</div><div><br></div><div><table border="0" cellpadding="0" cellspacing="0" width="362" style="border-collapse: collapse; width: 362pt; position: static; z-index: auto; ">
<!--StartFragment-->
 <col width="137" style="mso-width-source:userset;mso-width-alt:5010;width:137pt">
 <col width="75" span="3" style="width:75pt">
 <tbody><tr height="13" style="height:13.0pt">
  <td height="13" width="137" style="height:13.0pt;width:137pt"><b>Genre</b></td>
  <td class="xl66" width="75" style="width:75pt"><b>           No. files         </b></td>
  <td class="xl66" width="75" style="width:75pt"><b>        No. Words</b></td>
  <td class="xl66" width="75" style="width:75pt"><b>        Pct corpus</b></td>
 </tr>
 <tr height="13" style="height:13.0pt">
  <td height="13" style="height:13.0pt">Court transcript<span style="mso-spacerun:yes"> </span></td>
  <td align="right">2</td>
  <td align="right">30052</td>
  <td class="xl65" align="right">6%</td>
 </tr>
 <tr height="13" style="height:13.0pt">
  <td height="13" style="height:13.0pt">Debate transcript<span style="mso-spacerun:yes"> </span></td>
  <td align="right">2</td>
  <td align="right">32325</td>
  <td class="xl65" align="right">6%</td>
 </tr>
 <tr height="13" style="height:13.0pt">
  <td height="13" style="height:13.0pt">Email<span style="mso-spacerun:yes"> </span></td>
  <td align="right">78</td>
  <td align="right">27642</td>
  <td class="xl65" align="right">6%</td>
 </tr>
 <tr height="13" style="height:13.0pt">
  <td height="13" style="height:13.0pt">Essay<span style="mso-spacerun:yes"> </span></td>
  <td align="right">7</td>
  <td align="right">25590</td>
  <td class="xl65" align="right">5%</td>
 </tr>
 <tr height="13" style="height:13.0pt">
  <td height="13" style="height:13.0pt">Fiction<span style="mso-spacerun:yes"> </span></td>
  <td align="right">5</td>
  <td align="right">31518</td>
  <td class="xl65" align="right">6%</td>
 </tr>
 <tr height="13" style="height:13.0pt">
  <td height="13" style="height:13.0pt">Gov't documents<span style="mso-spacerun:yes"> </span></td>
  <td align="right">5</td>
  <td align="right">24578</td>
  <td class="xl65" align="right">5%</td>
 </tr>
 <tr height="13" style="height:13.0pt">
  <td height="13" style="height:13.0pt">Journal<span style="mso-spacerun:yes"> </span></td>
  <td align="right">10</td>
  <td align="right">25635</td>
  <td class="xl65" align="right">5%</td>
 </tr>
 <tr height="13" style="height:13.0pt">
  <td height="13" style="height:13.0pt">Letters<span style="mso-spacerun:yes"> </span></td>
  <td align="right">40</td>
  <td align="right">23325</td>
  <td class="xl65" align="right">5%</td>
 </tr>
 <tr height="13" style="height:13.0pt">
  <td height="13" style="height:13.0pt">Newspaper/newswire<span style="mso-spacerun:yes"> </span></td>
  <td align="right">41</td>
  <td align="right">23545</td>
  <td class="xl65" align="right">5%</td>
 </tr>
 <tr height="13" style="height:13.0pt">
  <td height="13" style="height:13.0pt">Non-fiction<span style="mso-spacerun:yes"> </span></td>
  <td align="right">4</td>
  <td align="right">25182</td>
  <td class="xl65" align="right">5%</td>
 </tr>
 <tr height="13" style="height:13.0pt">
  <td height="13" style="height:13.0pt">Spoken<span style="mso-spacerun:yes"> </span></td>
  <td align="right">11</td>
  <td align="right">25783</td>
  <td class="xl65" align="right">5%</td>
 </tr>
 <tr height="13" style="height:13.0pt">
  <td height="13" style="height:13.0pt">Technical<span style="mso-spacerun:yes"> </span></td>
  <td align="right">7</td>
  <td align="right">25426</td>
  <td class="xl65" align="right">5%</td>
 </tr>
 <tr height="13" style="height:13.0pt">
  <td height="13" style="height:13.0pt">Travel guides<span style="mso-spacerun:yes"> </span></td>
  <td align="right">7</td>
  <td align="right">26708</td>
  <td class="xl65" align="right">5%</td>
 </tr>
 <tr height="13" style="height:13.0pt">
  <td height="13" style="height:13.0pt">Twitter</td>
  <td align="right">2</td>
  <td align="right">24180</td>
  <td class="xl65" align="right">5%</td>
 </tr>
 <tr height="13" style="height:13.0pt">
  <td height="13" style="height:13.0pt">Blog</td>
  <td align="right">21</td>
  <td align="right">28199</td>
  <td class="xl65" align="right">6%</td>
 </tr>
 <tr height="13" style="height:13.0pt">
  <td height="13" style="height:13.0pt">ficlets</td>
  <td align="right">5</td>
  <td align="right">26299</td>
  <td class="xl65" align="right">5%</td>
 </tr>
 <tr height="13" style="height:13.0pt">
  <td height="13" style="height:13.0pt">movie script</td>
  <td align="right">2</td>
  <td align="right">28240</td>
  <td class="xl65" align="right">6%</td>
 </tr>
 <tr height="13" style="height:13.0pt">
  <td height="13" style="height:13.0pt">spam</td>
  <td align="right">110</td>
  <td align="right">23490</td>
  <td class="xl65" align="right">5%</td>
 </tr>
 <tr height="13" style="height:13.0pt">
  <td height="13" style="height:13.0pt">jokes</td>
  <td align="right">16</td>
  <td align="right">26582</td>
  <td class="xl65" align="right">5%</td>
 </tr>
 <tr height="13" style="height:13.0pt">
  <td height="13" style="height:13.0pt"></td>
  <td></td>
  <td></td>
  <td></td>
 </tr>
 <tr height="13" style="height:13.0pt">
  <td height="13" style="height:13.0pt"><b>TOTAL</b></td>
  <td align="right">375</td>
  <td align="right">504299</td>
  <td></td>
 </tr>
<!--EndFragment-->
</tbody></table><br>



</div><div><b>***************************************************************************************************************</b></div><div><b>We invite contribution of linguistic annotations of any kind and in any format of any portion of the data.</b></div><div><b>Contributed annotations will be made available to the community in both their original format and in GrAF</b></div><div><b>format compatible with other annotations of the data.</b></div><div><b>***************************************************************************************************************</b></div><div><b><br></b></div><div><b>New Annotations</b></div><div><b>---------------------</b></div><div>We have also made available Propbank annotations of a 40K subset of MASC that has been heavily</div><div>annotated by multiple groups for many different linguistic phenomena. These are currently distributed in the </div><div>original Propbank format (together with the Penn Treebank annotations on which they rely), The GrAF version </div><div>of the Propbank annotations will be made available this summer.</div><div><br></div><div><font class="Apple-style-span" face="Monaco">+-----------------------------------------------------------------------------------------+</font></div><div><font class="Apple-style-span" face="Monaco">|  MASC IS DEVELOPED AND DISTRIBUTED BY THE AMERICAN NATIONAL CORPUS PROJECT, WHICH IS    |</font></div><div><font class="Apple-style-span" face="Monaco">|  COMMITTED TO PROVIDING OPEN DATA. ALL MASC DATA AND ANNOTATIONS ARE FREELY DISTRIBUTED |</font></div><div><font class="Apple-style-span" face="Monaco">| </font><span class="Apple-style-span" style="font-family: Monaco; "> AND MAY BE USED AND REDISTRIBUTED FOR ANY PURPOSE, INCLUDING COMMERCIAL.               |</span></div><div><font class="Apple-style-span" face="Monaco">+-----------------------------------------------------------------------------------------+</font></div><div><br></div><div><br></div></body></html>