<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 3.2//EN">
<HTML>
<HEAD>
<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=iso-8859-1">
<META NAME="Generator" CONTENT="MS Exchange Server version 6.0.6396.0">
<TITLE>XML annotation guidelines</TITLE>
</HEAD>
<BODY>
<!-- Converted from text/rtf format -->

<P><FONT SIZE=2 FACE="Courier New">Dear Corporist Colleagues,</FONT>
</P>

<P><FONT SIZE=2 FACE="Courier New">We are in the process of converting our corpus of transcribed</FONT>

<BR><FONT SIZE=2 FACE="Courier New">academic speech from SGML to XML, and adding additional annotation.</FONT>

<BR><FONT SIZE=2 FACE="Courier New">Can anyone point us to some standards or (preferably) precedents </FONT>

<BR><FONT SIZE=2 FACE="Courier New">for XML-ized annotation of:</FONT>
</P>

<P><FONT SIZE=2 FACE="Courier New">1) POS tagging</FONT>

<BR><FONT SIZE=2 FACE="Courier New">and</FONT>

<BR><FONT SIZE=2 FACE="Courier New">2) pragmatic markup (e.g., text segments manually identified as 'narrative',</FONT>

<BR><FONT SIZE=2 FACE="Courier New">'disagreement', 'request', etc.)</FONT>
</P>

<P><FONT SIZE=2 FACE="Courier New">Within the TEI guidelines (P4), we've found some suggestions for the POS</FONT>

<BR><FONT SIZE=2 FACE="Courier New">tagging, (but nothing yet for something like our pragmatic categories), e.g.</FONT>
</P>

<P><FONT SIZE=2 FACE="Courier New"><s type="sentence"></FONT>

<BR><FONT SIZE=2 FACE="Courier New">   <w ana="at">The</w></FONT>

<BR><FONT SIZE=2 FACE="Courier New">   <w ana="nn1">victim</w></FONT>

<BR><FONT SIZE=2 FACE="Courier New">   <m ana="gen">'s</m></FONT>

<BR><FONT SIZE=2 FACE="Courier New">   <w ana="nn2">friends</w></FONT>

<BR><FONT SIZE=2 FACE="Courier New">...</FONT>

<BR><FONT SIZE=2 FACE="Courier New"></s></FONT>
</P>

<P><FONT SIZE=2 FACE="Courier New">But somehow this seems a bit more verbose than it needs to be.</FONT>

<BR><FONT SIZE=2 FACE="Courier New">Is this format standard, or are there other XML-style annotation</FONT>

<BR><FONT SIZE=2 FACE="Courier New">formats in use?</FONT>
</P>

<P><FONT SIZE=2 FACE="Courier New">Thanks much for any leads. We'd especially appreciate getting </FONT>

<BR><FONT SIZE=2 FACE="Courier New">pointers to specific sections of the TEI guidelines that we may be</FONT>

<BR><FONT SIZE=2 FACE="Courier New">overlooking, or references to any user-friendly documentation</FONT>

<BR><FONT SIZE=2 FACE="Courier New">(other than the TEI) -- the XCES seems to be lacking in this </FONT>

<BR><FONT SIZE=2 FACE="Courier New">respect at present.</FONT>
</P>

<P><FONT SIZE=2 FACE="Courier New">Sincerely,</FONT>
</P>

<P><FONT SIZE=2 FACE="Courier New">Rita Simpson & the MICASE team</FONT>

<BR><FONT SIZE=2 FACE="Courier New">English Language Institute</FONT>

<BR><FONT SIZE=2 FACE="Courier New">University of Michigan</FONT>
</P>
<BR>

</BODY>
</HTML>