<div dir="ltr"><div dir="ltr"><div dir="ltr"><div class="gmail_quote"><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><br>== Graphemes ==<br>
<br>
- the most frequent grapheme in transcriptions is <a><br>
- the next most frequent graphemes are <e>, <i>, <n>, but the order is <br>
different between archives.<br>
<br>
The fact that <a> is the most frequent grapheme is certainly plausible. <br>
But I am interested in explanations for the differences between <e>, <br>
<i>, <n>. Would we have expected these three, and which order would we <br>
have predicted?<br></blockquote><div><br></div><div><div>These are grapheme fractions from 344 items of vocabulary from 245 languages from different families (data appendix to Erben Johansson 2020 in press): </div><div><br></div><div>a 0.16</div><div>i 0.08</div><div>u 0.05</div><div>k 0.05</div><div>t 0.05</div><div>n 0.04</div><div>o 0.04</div><div>e 0.04</div><div>m 0.04</div><div>h 0.03</div><div>......</div><div><br></div></div><div>So I'd say the numbers you got are not very surprising. The differences in order, depending on how much variation they reflect, could be due to regional variations in the archives, or even chance alone.</div><div><br></div><div>all the best, H</div><div><br></div><div><div><div>Erben Johansson, Niklas, Anikin, A., Carling, G., & Holmer,</div><div>A. (2020). The typology of sound symbolism: Defining macro-concepts</div><div>via their semantic and phonetic features. Linguistic Typology (in</div><div>press).</div></div><div></div></div><div><br></div></div></div></div></div>