<div dir="ltr">Dear David,<br>Kibrik & Maisak (2021) propose a standard of transcribing spoken discourse, to be used in descriptive or documentary projects. In particular, the notion of "elementary discourse unit" is discussed, which is a "minimal step" in speech production from which sentences/utterances are built. See Kibrik (2019) for an extended discussion based on the Upper Kuskokwim data. On the segmentation of spontaneous speech into intonational phrases, see also Himmelmann et al. (2018).<div><br></div><div>Best,</div><div>Timur Maisak<br><br>Himmelmann N., Sandler M., Strunk J., Unterladstetter V. 2018. On the universality of intonational phrases: A cross-linguistic interrater study. Phonology. Vol. 35. No. 2. Pp. 207–245.<br><br>Kibrik A.A. 2019. Upper Kuskokwim (Athabaskan, Alaska): Elementary discourse units and other aspects of local discourse structure. Anthropological linguistics. Vol. 61. No. 2. Pp. 141–182.<br><br>Кибрик А.А., Майсак Т.А. 2021. Правила дискурсивной транскрипции для описательных и документационных исследований.Rhema. Рема. № 2. С. 23–45. <a href="https://rhema-journal.com/Rema_2021_2_Kibrik_Maisak.pdf">https://rhema-journal.com/Rema_2021_2_Kibrik_Maisak.pdf</a><br>(From a Special issue "Documentation, description, explanation: Aleksandr Е. Kibrik’s scientific heritage in the study of minor languages", <a href="https://rhema-journal.com/Rema-2-2021.pdf">https://rhema-journal.com/Rema-2-2021.pdf</a>)<br></div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">чт, 15 дек. 2022 г. в 12:36, David Gil <<a href="mailto:gil@shh.mpg.de">gil@shh.mpg.de</a>>:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">Ian, and everybody,<br>
<br>
My impression is that the notion of "utterance" is every bit as <br>
problematical as that of "word" — though it seems like there as not been <br>
as much discussion about utterances as there has been about words.<br>
<br>
I was particularly struck by the lack of clarity of the notion of <br>
utterance when developing our Max Planck Institute naturalistic corpora <br>
in Jakarta.  When transcribing our naturalistic data, our goal was to <br>
enter each utterance into a separate field in our database; however, we <br>
had no clear set of principles how to parse a continuous say hour-long <br>
text into such utterances.  While for many purposes it didn't really <br>
matter, for some it most clearly did.  Ian's proposed generalizations <br>
might be a case in point, but the case that struck me as most cogent was <br>
in the field of 1st language acquisition, for which we compiled a large <br>
corpus.  In child language studies, a central role is played by the <br>
notion of MLU, or Mean Length of Utterance, so obviously we wanted to <br>
examine our data in terms of MLU.  But it was patently clear that our <br>
parsings into utterances were arbitrary and problematical in many ways, <br>
which got me to wondering whether this was due to our own ignorance, or <br>
alternatively a more general problem that should perhaps be addressed.  <br>
I must confess I haven't thought much about this recently, but I'm now <br>
wondering:  Are there any go-to references on how to parse a text into <br>
utterances, or is this indeed a lacuna that still needs to be filled?<br>
<br>
David<br>
<br>
On 15/12/2022 07:31, Ian Joo wrote:<br>
> Dear typologists,<br>
><br>
> many grammars employ the terms “word-initial”, “word-final”, and “word-medial”, without specifying what a “word” is.<br>
> And, as we have discussed earlier, there is no consensus on what a “word” is, or whether it is a cross-linguistically valid concept.<br>
> But can we at least agree that the following concepts are universal: “utterance-initial”, “utterance-final”, and “utterance-medial”?<br>
> As all human utterances are finite (signed or spoken), the corollary is that there is a beginning, the ending, and phases in between.<br>
> For example, instead of saying that “a lect does not allow /r/ word-initially”, can we say that it does not allow /r/ utterance-initially?<br>
> Would it save us from the conceptual ambiguity of woordhood?<br>
><br>
>  From Hong Kong,<br>
> Ian<br>
> _______________________________________________<br>
> Lingtyp mailing list<br>
> <a href="mailto:Lingtyp@listserv.linguistlist.org" target="_blank">Lingtyp@listserv.linguistlist.org</a><br>
> <a href="https://listserv.linguistlist.org/cgi-bin/mailman/listinfo/lingtyp" rel="noreferrer" target="_blank">https://listserv.linguistlist.org/cgi-bin/mailman/listinfo/lingtyp</a><br>
<br>
-- <br>
David Gil<br>
<br>
Senior Scientist (Associate)<br>
Department of Linguistic and Cultural Evolution<br>
Max Planck Institute for Evolutionary Anthropology<br>
Deutscher Platz 6, Leipzig, 04103, Germany<br>
<br>
Email: <a href="mailto:gil@shh.mpg.de" target="_blank">gil@shh.mpg.de</a><br>
Mobile Phone (Israel): +972-526117713<br>
Mobile Phone (Indonesia): +62-082113720302<br>
<br>
_______________________________________________<br>
Lingtyp mailing list<br>
<a href="mailto:Lingtyp@listserv.linguistlist.org" target="_blank">Lingtyp@listserv.linguistlist.org</a><br>
<a href="https://listserv.linguistlist.org/cgi-bin/mailman/listinfo/lingtyp" rel="noreferrer" target="_blank">https://listserv.linguistlist.org/cgi-bin/mailman/listinfo/lingtyp</a><br>
</blockquote></div>