<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 3.2//EN">
<html>

<head>
<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=us-ascii">


<meta name=Generator content="Microsoft Word 10 (filtered)">
<title>RE: [Corpora-List] Brown Corpus</title>

<style>
<!--
 /* Font Definitions */
 @font-face
        {font-family:Tahoma;
        panose-1:2 11 6 4 3 5 4 4 2 4;}
 /* Style Definitions */
 p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0in;
        margin-bottom:.0001pt;
        font-size:12.0pt;
        font-family:"Times New Roman";}
a:link, span.MsoHyperlink
        {color:blue;
        text-decoration:underline;}
a:visited, span.MsoHyperlinkFollowed
        {color:purple;
        text-decoration:underline;}
p
        {margin-right:0in;
        margin-left:0in;
        font-size:12.0pt;
        font-family:"Times New Roman";}
span.EmailStyle18
        {color:black;}
@page Section1
        {size:8.5in 11.0in;
        margin:1.0in 1.25in 1.0in 1.25in;}
div.Section1
        {page:Section1;}
-->
</style>

</head>

<body lang=EN-US link=blue vlink=purple>

<div class=Section1>

<p class=MsoNormal style='margin-right:0in;margin-bottom:12.0pt;margin-left:
.5in'><font size=2 color=black face=Tahoma><span style='font-size:10.0pt;
font-family:Tahoma;color:black'>Is there anyone developing corpus sets that are
particular to specific publications?</span></font></p>

<p class=MsoNormal style='margin-right:0in;margin-bottom:12.0pt;margin-left:
.5in'><font size=2 color=black face=Tahoma><span style='font-size:10.0pt;
font-family:Tahoma;color:black'>We are interested in learning about American English
language newspaper vocabularies and how they map to specific subject categories
–specifically the subject classifications found in NewsML.  In our
ideal world such corpora would map to specific newspaper sections (the Boston
Globe Business section, the Chicago Tribune National News section, etc.). Our
goal is to track the differences in vocabularies used by specific publications to
describe common events and determine how these vocabularies differ from
academic journals and radio/TV articles on the same or closely related subject
areas.</span></font></p>

<p class=MsoNormal style='margin-bottom:12.0pt'><font size=2 color=black
face=Tahoma><span style='font-size:10.0pt;font-family:Tahoma;color:black'> </span></font></p>

<p class=MsoNormal style='margin-right:0in;margin-bottom:12.0pt;margin-left:
.5in'><font size=2 color=black face=Tahoma><span style='font-size:10.0pt;
font-family:Tahoma;color:black'>Jack Bryar</span></font></p>

<p class=MsoNormal style='margin-right:0in;margin-bottom:12.0pt;margin-left:
.5in'><font size=2 color=black face=Tahoma><span style='font-size:10.0pt;
font-family:Tahoma;color:black'> </span></font></p>

</div>

</body>

</html>