<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=Windows-1252">
</head>
<body>
<div dir="ltr" style="font-family: Aptos, Arial, Helvetica, sans-serif; font-size: 12pt; color: rgb(0, 0, 0);">
Dear all — Nothing much left to be added, except to say I personally like overviews of by-family/genus and by-area frequencies (expressed as percentages). So instead of a single number that is supposed to represent “the world”, I find it useful to know how
 the frequency/probability varies by family and area. — Best — Juergen</div>
<div dir="ltr" style="font-family: Aptos, Arial, Helvetica, sans-serif; font-size: 12pt; color: rgb(0, 0, 0);">
<br>
</div>
<div id="ms-outlook-mobile-signature">
<p style="margin: 0in; font-family: Calibri, sans-serif; font-size: 11pt;"><span style="font-family: Helvetica; font-size: 9pt; color: black;">Juergen Bohnemeyer (He/Him)<br>
Professor, Department of Linguistics<br>
University at Buffalo <br>
<br>
Office: 642 Baldy Hall, UB North Campus<br>
Mailing address: 609 Baldy Hall, Buffalo, NY 14260 <br>
Phone: (716) 645 0127 <br>
Fax: (716) 645 3825<br>
Email: </span><span style="font-family: Helvetica; font-size: 9pt; color: rgb(0, 120, 212);"><u><a href="mailto:jb77@buffalo.edu" title="mailto:jb77@buffalo.edu" data-outlook-id="c4b4f991-9376-4839-bbe7-d347c07729f9" style="color: rgb(0, 120, 212); margin-top: 0px; margin-bottom: 0px;">jb77@buffalo.edu</a></u></span><span style="font-family: Helvetica; font-size: 9pt; color: black;"><br>
Web: </span><span style="font-family: Helvetica; font-size: 9pt; color: rgb(5, 99, 193);"><u><a href="http://www.acsu.buffalo.edu/~jb77/" title="http://www.acsu.buffalo.edu/~jb77/" data-outlook-id="c78d90ec-3ba5-4d9d-a8ed-27a6e871f77f" style="color: rgb(5, 99, 193); margin-top: 0px; margin-bottom: 0px;">http://www.acsu.buffalo.edu/~jb77/</a></u></span><span style="font-family: Helvetica; font-size: 9pt; color: black;"> <br>
<br>
</span><span style="color: black;">Office hours Tu/Th 3:30-4:30pm in 642 Baldy or via Zoom (Meeting ID 585 520 2411; Passcode Hoorheh) </span><span style="font-family: Helvetica; font-size: 9pt; color: black;"><br>
<br>
There’s A Crack In Everything - That’s How The Light Gets In <br>
(Leonard Cohen)  </span></p>
<p style="margin: 0in; font-family: Calibri, sans-serif; font-size: 11pt;">-- </p>
<p style="margin: 0in; font-family: Calibri, sans-serif; font-size: 11pt;"> </p>
</div>
<div id="mail-editor-reference-message-container">
<div class="ms-outlook-mobile-reference-message skipProofing">
<meta name="Generator" content="Microsoft Exchange Server">
</div>
<div class="ms-outlook-mobile-reference-message skipProofing" style="text-align: left; padding: 3pt 0in 0in; border-width: 1pt medium medium; border-style: solid none none; border-color: rgb(181, 196, 223) currentcolor currentcolor; font-family: Aptos; font-size: 12pt; color: black;">
<b>From: </b>Lingtyp <lingtyp-bounces@listserv.linguistlist.org> on behalf of Michael Cysouw via Lingtyp <lingtyp@listserv.linguistlist.org><br>
<b>Date: </b>Wednesday, November 19, 2025 at 11:12<br>
<b>To: </b>Lingtyp <lingtyp@listserv.linguistlist.org><br>
<b>Subject: </b>Re: [Lingtyp] Reporting cross-linguistic frequencies<br>
<br>
</div>
<div class="PlainText" style="font-size: 11pt;">Dear Omri,<br>
<br>
The real question is what you want to report. There is real value in all numbers that you propose, so simply report them all, explaining how you obtained them.<br>
<br>
I think that your question arose because of the misconception (in my opinion) that there is something like the “true” frequencies of a typological parameter. They do not exist. Any frequency measured depends on many assumptions, including that the current linguistic
 situation in the world’s languages might very well be different from any situation in the (far) past or (far) future. Even something like estimates of the stable state from a dynamic model of typological transition probabilities (my favourite kind of numbers)
 is probably just a reflection of the forces influencing languages over the last few thousand years. That is very interesting (I think), but still just one aspect of human language.<br>
<br>
best<br>
Michael<br>
<br>
————————<br>
Prof. Dr. Michael Cysouw<br>
Forschungszentrum Deutscher Sprachatlas<br>
Philipps Universität Marburg<br>
Pilgrimstein 16<br>
D-35032 Marburg<br>
<br>
Office: +49-6421-28-22488<br>
Secretary: +49-6421-28-22483<br>
Email: cysouw@uni-marburg.de<br>
Web: <a href="http://www.deutscher-sprachatlas.de/mitarbeiter/cysouw/" data-outlook-id="0c07a86a-00c5-456d-b036-4b439b2dbac2">
https://nam12.safelinks.protection.outlook.com/?url=http%3A%2F%2Fwww.deutscher-sprachatlas.de%2Fmitarbeiter%2Fcysouw%2F&data=05%7C02%7Cjb77%40buffalo.edu%7C216764a501ae438eba6708de2786680e%7C96464a8af8ed40b199e25f6b50a20250%7C0%7C0%7C638991655443277976%7CUnknown%7CTWFpbGZsb3d8eyJFbXB0eU1hcGkiOnRydWUsIlYiOiIwLjAuMDAwMCIsIlAiOiJXaW4zMiIsIkFOIjoiTWFpbCIsIldUIjoyfQ%3D%3D%7C0%7C%7C%7C&sdata=Wzf%2Btm0Kzc5U2SgCMLxieHVoNBYUC4MP%2BOgG0SFuQno%3D&reserved=0</a><br>
Web: <a href="http://www.cysouw.de/home/" data-outlook-id="a9208b57-f856-4197-8c35-cc22974a90af">
https://nam12.safelinks.protection.outlook.com/?url=http%3A%2F%2Fwww.cysouw.de%2Fhome%2F&data=05%7C02%7Cjb77%40buffalo.edu%7C216764a501ae438eba6708de2786680e%7C96464a8af8ed40b199e25f6b50a20250%7C0%7C0%7C638991655443302338%7CUnknown%7CTWFpbGZsb3d8eyJFbXB0eU1hcGkiOnRydWUsIlYiOiIwLjAuMDAwMCIsIlAiOiJXaW4zMiIsIkFOIjoiTWFpbCIsIldUIjoyfQ%3D%3D%7C0%7C%7C%7C&sdata=haosvaScW1YGqz62s6sNIHlSgzpxa%2FPlE4WqN%2FT%2Fg8E%3D&reserved=0</a><br>
ORCID: orcid.org/0000-0003-3168-4946<br>
<br>
Standort Biegenstrasse, Gebäude B|05<br>
Pilgrimstein 16, Raum 106 (+1/0060)<br>
<a href="http://www.uni-marburg.de/kontakt/" data-outlook-id="78541b2d-7586-40b2-8a10-f3fe3909ef48">https://nam12.safelinks.protection.outlook.com/?url=http%3A%2F%2Fwww.uni-marburg.de%2Fkontakt%2F&data=05%7C02%7Cjb77%40buffalo.edu%7C216764a501ae438eba6708de2786680e%7C96464a8af8ed40b199e25f6b50a20250%7C0%7C0%7C638991655443319150%7CUnknown%7CTWFpbGZsb3d8eyJFbXB0eU1hcGkiOnRydWUsIlYiOiIwLjAuMDAwMCIsIlAiOiJXaW4zMiIsIkFOIjoiTWFpbCIsIldUIjoyfQ%3D%3D%7C0%7C%7C%7C&sdata=98O4DdN2jJC8xJwk8Xo7usjjsJ0hPfCvV1igOaROow8%3D&reserved=0</a><br>
————————<br>
<br>
> On 18. Nov 2025, at 10:23, Omri Amiraz via Lingtyp <lingtyp@listserv.linguistlist.org> wrote:<br>
><br>
> Dear Colleagues,<br>
> I would like to raise the question of how cross-linguistic frequencies of typological features ought to be reported. The issue has been discussed extensively, but I still find some aspects conceptually confusing, so I hope this discussion might be helpful
 for others as well.<br>
> To make this concrete, consider the order of object and verb (OV, VO, no dominant order). Suppose, for the sake of argument, that we have complete data for every language in Glottolog. This would give us theactual proportion of languages that are OV vs. VO
 in the present-day world. The core problem, however, is that languages are not independent datapoints, so these actual frequencies also reflect genealogical and areal biases.<br>
> For that reason, it is common practice to report adjusted frequencies instead, either through non-proportional stratified sampling (Dryer 2018) or through statistical bias controls (Becker & Guzmán Naranjo 2025). As far as I understand, both methods aim to
 estimate something like: If each language were independent (as if every language were an isolate and had no contact with its neighbors), what proportion would be OV vs. VO? In other words, the population being described is not the set of existing languages
 but a hypothetical (and unrealistic) set of independent languages.<br>
> Now, suppose that the actual frequencies of OV and VO are equal, but the adjusted frequency of OV is higher. In that case, it feels counterintuitive to say that OV is more common cross-linguistically than VO. Perhaps it is clearer to speak in terms of probabilities
 rather than proportions, given that the population is hypothetical. For instance, we might say: “When genealogical and areal biases are controlled for, the probability of a language being OV is 0.6". This means that the chance that a randomly sampled language
 isolate with no contact would be OV is 0.6. By contrast, saying “60% of the world’s languages are OV” when referring to an adjusted frequency seems potentially misleading.<br>
> I would appreciate hearing what others in the community think about how such statistics should ideally be reported.<br>
> Best regards,<br>
> Omri<br>
><br>
> References:<br>
> Becker, Laura and Guzmán Naranjo Matías. 2025. Replication and methodological robustness in quantitative typology. Linguistic Typology.<br>
> Dryer, Matthew S. 2018. On the order of demonstrative, numeral, adjective, and noun. Language 94(4), 798-833.<br>
> _______________________________________________<br>
> Lingtyp mailing list<br>
> Lingtyp@listserv.linguistlist.org<br>
> <a href="https://listserv.linguistlist.org/cgi-bin/mailman/listinfo/lingtyp" data-outlook-id="40572097-97b2-4496-861c-e12d5e87b312">
https://nam12.safelinks.protection.outlook.com/?url=https%3A%2F%2Flistserv.linguistlist.org%2Fcgi-bin%2Fmailman%2Flistinfo%2Flingtyp&data=05%7C02%7Cjb77%40buffalo.edu%7C216764a501ae438eba6708de2786680e%7C96464a8af8ed40b199e25f6b50a20250%7C0%7C0%7C638991655443334931%7CUnknown%7CTWFpbGZsb3d8eyJFbXB0eU1hcGkiOnRydWUsIlYiOiIwLjAuMDAwMCIsIlAiOiJXaW4zMiIsIkFOIjoiTWFpbCIsIldUIjoyfQ%3D%3D%7C0%7C%7C%7C&sdata=l7%2BU9lqfzlIvY%2BV%2BMlBauhH6ZDUGBM%2BPAu%2FVjH6vNGc%3D&reserved=0</a><br>
<br>
<br>
_______________________________________________<br>
Lingtyp mailing list<br>
Lingtyp@listserv.linguistlist.org<br>
<a href="https://listserv.linguistlist.org/cgi-bin/mailman/listinfo/lingtyp" data-outlook-id="3904d6d1-a3c3-4fe3-a3f1-79c9b6def243">https://nam12.safelinks.protection.outlook.com/?url=https%3A%2F%2Flistserv.linguistlist.org%2Fcgi-bin%2Fmailman%2Flistinfo%2Flingtyp&data=05%7C02%7Cjb77%40buffalo.edu%7C216764a501ae438eba6708de2786680e%7C96464a8af8ed40b199e25f6b50a20250%7C0%7C0%7C638991655443352943%7CUnknown%7CTWFpbGZsb3d8eyJFbXB0eU1hcGkiOnRydWUsIlYiOiIwLjAuMDAwMCIsIlAiOiJXaW4zMiIsIkFOIjoiTWFpbCIsIldUIjoyfQ%3D%3D%7C0%7C%7C%7C&sdata=llvb%2FZ9EwldKBuaGjQOS5XqhtpSFQqK%2FA5yYBo0nd5A%3D&reserved=0</a><br>
</div>
</div>
</body>
</html>