<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN">
<HTML><HEAD>
<META http-equiv=Content-Type content="text/html; charset=iso-8859-1">
<META content="MSHTML 6.00.2800.1400" name=GENERATOR>
<STYLE></STYLE>
</HEAD>
<BODY bgColor=#ffffff>
<DIV>Dear All,</DIV>
<DIV> </DIV>
<DIV>I am in the process of preparing an introductory course on language and 
gender and was thinking about compiling a "language and gender studies corpus 
sampler" for my students so they can carry out some small-scale empirical 
research projects to base their term papers on. For this sampler it would be 
ideal to have spoken and/or written corpora with (roughly comparable) male and 
female subsections, or just all-male/all-female talk/writing corpora, or maybe 
even collections of exclusively gay and/or lesbian language. </DIV>
<DIV> </DIV>
<DIV>I'm going to include a couple of small and specialised home-made corpora 
(literary texts, book reviews, pop/rap song lyrics...), but would also like to 
use larger and less specialised ones, such as COLT and (parts of) the 
BNC. Does anyone know about a possibility to extract from these corpora 
all-female and all-male conversations or male/female authored texts (without 
having to read the headers of 4,000+ text files)? I had a look at David Lee's 
"BNC Index" Excel spreadsheet but couldn't find sex indicators for spoken texts 
(maybe most of them are mixed sex anyway). Also, I would be grateful for 
pointers to other corpora which might be appropriate for L&G-related 
research (MICASE online is already on my list; and I've subdivided the 
transcript files of the Santa Barbara Corpus of Spoken American English into 
male/female/mixed groups). </DIV>
<DIV> </DIV>
<DIV>Best wishes and thanks in advance... Ute</DIV>
<DIV> </DIV>
<DIV> </DIV>
<DIV>************************************************************</DIV>
<DIV> </DIV>
<DIV>Ute Römer<BR>English Department<BR>University of Hanover<BR>Königsworther 
Platz 1<BR>30167 Hannover<BR>Germany</DIV>
<DIV> </DIV>
<DIV>Phone: +49 (0)511 762 2997<BR>Fax: +49 (0)511 762 2996<BR>E-mail: <A 
href="mailto:ute.roemer@anglistik.uni-hannover.de">ute.roemer@anglistik.uni-hannover.de</A><BR><A 
href="http://www.fbls.uni-hannover.de/angli/">http://www.fbls.uni-hannover.de/angli/</A></DIV>
<DIV> </DIV>
<DIV> </DIV></BODY></HTML>