Dear Karin<div><br></div><div>> more proper nouns in news paper text than in fiction<br><br>certainly true.  In general, the more formal/informational a text is, the more nominal, with more nouns, adjs/determiners; the more informal/interactional, the more verbs and pronouns.  Fiction and newspaper are noteworthy for past tenses and 3rd-person pronouns. <div>


<br></div><div>Mark Davies and Andrew Hardie have already mentioned Doug Biber's work, I'll just add what I think of as the key/original reference, his "Variation across Speech and Writing", CUP 1988.</div>

<div><br>
</div><div>Sketch Engine has support for all such research, you can easily find contrasting POS-tag frequencies between corpora/subcorpora under 'wordlist' functionality (for any tagged corpora/languages)</div><div>


<br></div><div>Another favourite reference of mine: Heylighen and Dewaele <a href="http://pespmc1.vub.ac.be/Papers/Formality.pdf">http://pespmc1.vub.ac.be/Papers/Formality.pdf</a></div><div><br></div><div>My own recent contribution: </div>

<div><a class="attachment" href="http://trac.sketchengine.co.uk/attachment/wiki/AK/Papers/Kilgarriff_TSD2012.pdf?format=raw" title="Attachment 'Kilgarriff_TSD2012.pdf' in AK/Papers" style="text-decoration:initial;color:rgb(51,113,186);border-bottom-width:1px;border-bottom-style:dotted;border-bottom-color:rgb(187,187,187);font-family:Verdana,sans-serif;font-size:12px;line-height:16.78333282470703px;background-color:rgb(255,255,255)">Getting to know your corpus</a><a class="trac-rawlink" href="http://trac.sketchengine.co.uk/raw-attachment/wiki/AK/Papers/Kilgarriff_TSD2012.pdf?format=raw" title="Download" style="text-decoration:initial;color:rgb(51,113,186);border-bottom-style:none;background-image:url(http://trac.sketchengine.co.uk/chrome/common/download.png);background-color:rgb(255,255,255);padding-right:16px;font-family:Verdana,sans-serif;font-size:12px;line-height:16.78333282470703px;background-repeat:no-repeat no-repeat"></a> <span style="background-color:rgb(255,255,255);font-family:Verdana,sans-serif;font-size:12px;line-height:16.78333282470703px">in:</span><span style="background-color:rgb(255,255,255);font-family:Verdana,sans-serif;font-size:12px;line-height:16.78333282470703px"> </span><em style="background-color:rgb(255,255,255);font-family:Verdana,sans-serif;font-size:12px;line-height:16.78333282470703px">Proc. Text, Speech, Dialogue (TSD 2012)</em><span style="background-color:rgb(255,255,255);font-family:Verdana,sans-serif;font-size:12px;line-height:16.78333282470703px">, Lecture Notes in Computer Science. Sojka, P., Horak, A., Kopecek, I., Pala, K. (eds). Springer.</span><div>

<br></div><div>Best,</div><div><br></div><div>  Adam</div><div><br></div><div><br><div class="gmail_quote">On 12 December 2012 10:00, Karin Cavallin <span dir="ltr"><<a href="mailto:karin.cavallin@ling.gu.se" target="_blank">karin.cavallin@ling.gu.se</a>></span> wrote:<br>


<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Does anyone know of any study of the difference in (and an analysis of the reasons) part-of-speech tag distribution in different genres? A quick study I made yesterday showed e.g. that my working hypothesis that there are more proper nouns in news paper text than in fiction was correct, at least on the data I examined.<br>



<br>
Karin Cavallin<br>
PhD Student in Computational Linguistics<br>
University of Gothenburg, Sweden<br>
<br>
_______________________________________________<br>
UNSUBSCRIBE from this page: <a href="http://mailman.uib.no/options/corpora" target="_blank">http://mailman.uib.no/options/corpora</a><br>
Corpora mailing list<br>
<a href="mailto:Corpora@uib.no" target="_blank">Corpora@uib.no</a><br>
<a href="http://mailman.uib.no/listinfo/corpora" target="_blank">http://mailman.uib.no/listinfo/corpora</a><br>
</blockquote></div><br><br clear="all"><div><br></div>-- <br>========================================<br><a href="http://www.kilgarriff.co.uk/" target="_blank">Adam Kilgarriff</a>                  <a href="mailto:adam@lexmasterclass.com" target="_blank">adam@lexmasterclass.com</a>                                             <br>


Director                                    <a href="http://www.sketchengine.co.uk/" target="_blank">Lexical Computing Ltd</a>                <br>Visiting Research Fellow                 <a href="http://leeds.ac.uk" target="_blank">University of Leeds</a>     <div>


<i><font color="#006600">Corpora for all</font></i> with <a href="http://www.sketchengine.co.uk" target="_blank">the Sketch Engine</a>                 </div><div>                        <i><a href="http://www.webdante.com" target="_blank">DANTE: <font color="#009900">a lexical database for English</font></a><font color="#009900"> </font>                 </i><div>


========================================</div></div><br>
</div></div></div>