<HTML>
<HEAD>
<TITLE>Re: Typological studies based on original texts</TITLE>
</HEAD>
<BODY>
<FONT FACE="Verdana, Helvetica, Arial"><SPAN STYLE='font-size:12.0px'>Nick makes a good point. To back up with some numbers: in the SMG we investigated how various typological claims would work out in a one million word corpus of a single language. Gathering the data from an existing corpus took a person-year of work. (The language was the exotic but not totally unknown language Russian.) One of the outputs, which like Nick's example you may not want to count, appeared in the Bybee/Hopper volume <I>Frequency and the emergence of linguistic structure</I> (2001) - I’ll send details if you want them. While we found out a lot of what we wanted to know, for one of our key questions one million words proved insufficient. So there's also the converse of Nick's problem: corpus work may require extensive information for each single language.<BR>
Best wishes<BR>
Greville Corbett<BR>
<BR>
<BR>
On 3/4/06 10:08, "Nick Evans" <nrde@UNIMELB.EDU.AU> wrote:<BR>
<BR>
<FONT COLOR="#0000FF">> Berni, an interesting question, and I agree it's <BR>
> very important, though my preference would be to <BR>
> lower the number of languages: large sample sizes <BR>
> can often get in the way of perceptiveness about <BR>
> what's going on, and the most interesting things <BR>
> happening in texts often require you to have the <BR>
> sort of detailed knowledge of language structure <BR>
> that isn't possible to extend to large numbers of <BR>
> languages.<BR>
> An example which I don't know if you'd count is <BR>
> Nikolaus Himmelmann's 1997 Deiktikon, Artikel, <BR>
> Nominalphrase. Zur Emergenz syntaktischer Struktur<BR>
> which really takes advantage of a text based <BR>
> approach to identify emergent structures, in this <BR>
> case the NP or emergent precursor therefore.<BR>
> Best, Nick Evans<BR>
> <BR>
</FONT><FONT COLOR="#008000">>> Dear colleagues<BR>
>> <BR>
>> Does anybody know of any typological investigation based mainly or in a<BR>
>> substantial part on the material of original texts in a large number of<BR>
>> languages (say, 20 or more). There are by now <BR>
>> many typological studies based on<BR>
>> reference grammars, and even some based on questionnaires, parallel texts, <BR>
>> and<BR>
>> story stimuli (Pear stories, Frog stories) but it seems to me--I would be <BR>
>> very<BR>
>> pleased to be wrong--that there are virtually no large-scale studies based<BR>
>> mainly or exclusively on original texts. One <BR>
>> study I am aware of is the following:<BR>
>> <BR>
>> Güldemann, Tom. (2001). Quotative constructions in African languages: a<BR>
>> synchronic and diachronic survey. Habilitationsschrift Leipzig. Unpublished<BR>
>> [based on texts in 39 African languages]<BR>
>> <BR>
>> In a way it seems to be strange that there are few such studies, because<BR>
>> Greenberg, who was so influential in other <BR>
>> respects, made some pilot studies in<BR>
>> this direction:<BR>
>> <BR>
>> Greenberg, Joseph H. (1960). A quantitative approach to the morphological<BR>
>> typology of languages. International Journal of <BR>
>> American Linguistics 26: 178-194.<BR>
>> Greenberg, Joseph H. & O'Sullivan, Chris. (1974). Frequency, marking and<BR>
>> discourse styles with special reference to substantival categories in the<BR>
>> Romance languages. Working Papers on Language Universals 16: 47-72.<BR>
>> <BR>
>> Connected to the few typological studies based <BR>
>> on original texts there is a low<BR>
>> prestige associated with careful editions of texts (with translations and<BR>
>> glosses). As a consequence of the intensive <BR>
>> typological work based on reference<BR>
>> grammars, it seems that reference grammars have <BR>
>> acquired a higher status during<BR>
>> the last decades in ever more places (more libraries buy them, more linguists<BR>
>> write and publish grammars, it becomes a possible topic for a Ph.D. thesis in<BR>
>> more and more universities). The same does not hold for text collections <BR>
>> (most<BR>
>> libraries do not buy them, most universities will not accept an edited text<BR>
>> collection as a Ph.D., many linguists never publish their collected texts or<BR>
>> only a small portion).<BR>
>> <BR>
>> Please, send references to me about typological <BR>
>> studies based mainly on original<BR>
>> texts in more than 20 languages and including at least some non-European<BR>
>> languages. If there will be any answers I’ll make a survey.<BR>
>> <BR>
>> <BR>
>> Bernhard Waelchli<BR>
>> Max Planck Institute for Evolutionary Anthropology<BR>
>> Department of Linguistics<BR>
>> Deutscher Platz 6<BR>
>> 04103 Leipzig<BR>
>> Germany<BR>
>> <BR>
>> <BR>
>> --<BR>
>> ========================================<BR>
>> Bernhard Waelchli<BR>
>> University of Berne<BR>
>> bernhard.waelchli@isw.unibe.ch<BR>
>> <BR>
>> ------------------------------------------------------<BR>
>> This mail was sent through IMP at <a href="http://mail.unibe.ch">http://mail.unibe.ch</a><BR>
</FONT><BR>
-- <BR>
Greville G. Corbett<BR>
<BR>
Surrey Morphology Group<BR>
CMC, <BR>
School of Arts, Communication and Humanities<BR>
University of Surrey<BR>
Guildford                             email: g.corbett@surrey.ac.uk<BR>
Surrey, GU2 7XH                       FAX:   +44 1483 686201<BR>
Great Britain                         phone:  +44 1483 682849<BR>
<a href="http://www.surrey.ac.uk/LIS/SMG/">http://www.surrey.ac.uk/LIS/SMG/</a><BR>
<BR>
</SPAN></FONT>
</BODY>
</HTML>