<div dir="ltr"><div class="gmail_default" style="font-family:verdana,sans-serif;font-size:small">Thanks Sebastian, </div><div class="gmail_default" style="font-family:verdana,sans-serif;font-size:small"><br></div><div class="gmail_default" style="font-family:verdana,sans-serif;font-size:small">Another stupendous initiative of our favourite linguistics press.</div><div class="gmail_default" style="font-family:verdana,sans-serif;font-size:small"><br></div><div class="gmail_default" style="font-family:verdana,sans-serif;font-size:small">best,</div><div class="gmail_default" style="font-family:verdana,sans-serif;font-size:small">kofi</div><div><div dir="ltr" class="gmail_signature" data-smartmail="gmail_signature"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div><font size="1" color="#666666" face="arial, helvetica, sans-serif">————<br></font></div><font size="1" face="arial, helvetica, sans-serif"><font color="#666666">Dr Kofi Yakpo • Associate Professor </font></font></div><div dir="ltr"><span style="color:rgb(102,102,102);font-family:arial,helvetica,sans-serif;font-size:x-small">Chair of </span><a href="http://www.linguistics.hku.hk/" style="font-family:arial,helvetica,sans-serif;font-size:x-small" target="_blank"><font color="#6fa8dc">Linguistics</font></a><span style="color:rgb(102,102,102);font-family:arial,helvetica,sans-serif;font-size:x-small"> </span><span style="color:rgb(102,102,102);font-family:arial,helvetica,sans-serif;font-size:x-small">•</span><span style="color:rgb(102,102,102);font-family:arial,helvetica,sans-serif;font-size:x-small"> </span><font size="1" face="arial, helvetica, sans-serif"><a href="http://arts.hku.hk/" target="_blank"><font color="#6fa8dc">University of Hong Kong</font></a></font></div><div><span style="color:rgb(102,102,102);font-family:arial,helvetica,sans-serif;font-size:x-small">My publications @ </span><a href="https://zenodo.org/search?page=1&size=20&q=yakpo&sort=-publication_date" style="font-family:arial,helvetica,sans-serif;font-size:x-small" target="_blank"><font color="#6fa8dc">zenodo</font></a> <span style="color:rgb(102,102,102);font-family:arial,helvetica,sans-serif;font-size:x-small">• </span><span style="font-family:arial,helvetica,sans-serif;font-size:x-small;color:rgb(102,102,102)"> </span><a href="http://hub.hku.hk/cris/rp/rp01715" style="font-family:arial,helvetica,sans-serif;font-size:x-small" target="_blank"><font color="#6fa8dc">My Page</font></a></div><div><br></div><div><span style="color:rgb(102,102,102);font-family:arial,helvetica,sans-serif;font-size:x-small">Just published:</span><br></div><div><a href="https://doi.org/10.3389/fpsyg.2021.690593" style="font-family:arial,helvetica,sans-serif;font-size:x-small" target="_blank"><font color="#6fa8dc">Creole prosodic systems are areal, not simple</font></a><span style="color:rgb(102,102,102);font-family:arial,helvetica,sans-serif;font-size:x-small"><br></span></div><div><a href="https://journals.sagepub.com/doi/full/10.1177/13670069211019126" style="font-family:arial,helvetica,sans-serif;font-size:x-small" target="_blank"><font color="#6fa8dc">Social entrenchment influences the amount of areal borrowing</font></a> <br></div><div><a href="https://doi.org/10.1177/13670069211019126" style="font-family:arial,helvetica,sans-serif;font-size:x-small" target="_blank"><font color="#6fa8dc">Unidirectional multilingual convergence</font></a><span style="color:rgb(102,102,102);font-family:arial,helvetica,sans-serif;font-size:x-small"><br></span></div><div><a href="https://www.cambridge.org/core/journals/english-today/article/abs/two-types-of-language-contact-involving-english-creoles/DD2FC19B55E041440F3BFC5235234968" style="font-family:arial,helvetica,sans-serif;font-size:x-small" target="_blank"><font color="#6fa8dc">Two types of language contact involving English Creoles</font></a> <span style="color:rgb(102,102,102);font-family:arial,helvetica,sans-serif;font-size:x-small"><br></span></div><div><br></div><div> </div></div></div></div></div><div dir="ltr"><div>

</div></div></div></div></div></div></div></div></div></div></div></div></div></div></div></div></div></div></div></div></div></div></div></div></div></div></div></div></div></div></div></div></div></div></div></div></div></div></div></div></div></div></div></div></div></div></div></div></div></div></div></div></div></div></div></div></div></div></div></div></div></div></div></div></div><br></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Thu, Mar 24, 2022 at 3:15 PM Sebastian Nordhoff <<a href="mailto:sebastian.nordhoff@glottotopia.de">sebastian.nordhoff@glottotopia.de</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">Dear list members,<br>
there has been some discussion about "hit", "kill", "John", "Mary", and <br>
other usual suspects. Over the past months, we have worked on a corpus <br>
of all examples found in Language Science Press books. This corpus is <br>
now available in a beta version at <a href="http://imtvault.org" rel="noreferrer" target="_blank">imtvault.org</a>. It contains 40648 <br>
interlinear examples from 124 different languages and can be filtered <br>
along various criteria. For instance, we can search for John, Mary, or <br>
Peter.<br>
<br>
<a href="https://imtvault.org/?q=John" rel="noreferrer" target="_blank">https://imtvault.org/?q=John</a>: 266 hits<br>
<a href="https://imtvault.org/?q=Mary" rel="noreferrer" target="_blank">https://imtvault.org/?q=Mary</a>: 223 hits<br>
<a href="https://imtvault.org/?q=Peter" rel="noreferrer" target="_blank">https://imtvault.org/?q=Peter</a>: 232 hits<br>
<br>
We can look into the popularity of certain verbs:<br>
<br>
<a href="https://imtvault.org/?q=hit" rel="noreferrer" target="_blank">https://imtvault.org/?q=hit</a>: 399 hits<br>
<a href="https://imtvault.org/?q=kill" rel="noreferrer" target="_blank">https://imtvault.org/?q=kill</a>: 440 hits<br>
<a href="https://imtvault.org/?q=love" rel="noreferrer" target="_blank">https://imtvault.org/?q=love</a>: 181 hits<br>
<a href="https://imtvault.org/?q=kiss" rel="noreferrer" target="_blank">https://imtvault.org/?q=kiss</a>: 26 hits<br>
<a href="https://imtvault.org/?q=carry" rel="noreferrer" target="_blank">https://imtvault.org/?q=carry</a>: 235 hits<br>
<br>
We have also retrieved semantic categories, so you get<br>
<a href="https://imtvault.org/?parententities[0]=Crop" rel="noreferrer" target="_blank">https://imtvault.org/?parententities[0]=Crop</a><br>
which gives you examples about tobacco, rice, barley, wheat and so on.<br>
<br>
Other categories which might be interesting:<br>
<a href="https://imtvault.org/?parententities[0]=Weapon" rel="noreferrer" target="_blank">https://imtvault.org/?parententities[0]=Weapon</a>: 89 hits<br>
<a href="https://imtvault.org/?parententities[0]=Hazard" rel="noreferrer" target="_blank">https://imtvault.org/?parententities[0]=Hazard</a>: 205 hits<br>
<br>
You can also filter for grammatical categories. In the examples in the <br>
corpus, 2808 have a plural morpheme in them, while 2116 have a singular <br>
morpheme. Accusative (1937) is more popular than genitive (1601), dative <br>
(1309) or nominative (1232).<br>
<br>
The content of the corpus is obviously skewed by the following criteria:<br>
1) The coverage of the input books. Australia for instance is severely <br>
underrepresented.<br>
2) The length of the input books. "A grammar of Japhug" is 1600 pages, <br>
so you are likely to get a lot of Japhug grammatical categories.<br>
3) The source code of the books. We extract the examples from the tex <br>
files used to generate the pdf, and assume certain conventions. If a <br>
book author does not follow these conventions, we are not able to <br>
retrieve the examples.<br>
<br>
All this means that the corpus, despite its size, is still <br>
opportunistic. But it can maybe trigger some interesting ideas, which <br>
can be pursued further by a more systematic approach. We are also <br>
working on making the data available for machine queries so that you can <br>
import the corpus into R or similar and run your own statistics.<br>
<br>
There are still some rough edges here and there, but we will be working <br>
on ironing them out. If you have any suggestions or feature requests, <br>
feel free to contact me.<br>
<br>
Best wishes<br>
Sebastian (also on behalf of Thomas Krämer)<br>
<br>
PS: If you are wondering about the high frequency of Greek philosophers, <br>
they are all from our translation of Wackernagel's "On a law of <br>
Indo-European word order"<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
_______________________________________________<br>
Lingtyp mailing list<br>
<a href="mailto:Lingtyp@listserv.linguistlist.org" target="_blank">Lingtyp@listserv.linguistlist.org</a><br>
<a href="http://listserv.linguistlist.org/mailman/listinfo/lingtyp" rel="noreferrer" target="_blank">http://listserv.linguistlist.org/mailman/listinfo/lingtyp</a><br>
</blockquote></div>