<html><head><meta http-equiv="content-type" content="text/html; charset=utf-8"></head><body dir="auto"><div dir="ltr"></div><div dir="ltr">Ok, thanks. </div><div dir="ltr"><br><blockquote type="cite">On Nov 18, 2025, at 5:25 PM, Leonid Spektor <spektor@andrew.cmu.edu> wrote:<br><br></blockquote></div><blockquote type="cite"><div dir="ltr"><meta http-equiv="content-type" content="text/html; charset=us-ascii">Hi Jenny,<div><br></div><div><span class="Apple-tab-span" style="white-space:pre"> </span>Browser CLAN is over 5 years old. It is not longer compatible with the data format. Until people in charge of the web things here at CMU update it to the latest version, please tell your students to rely on downloaded transcripts using CLAN only for accurate result. <br><div>
<br class="Apple-interchange-newline"><br style="caret-color: rgb(0, 0, 0); color: rgb(0, 0, 0); font-family: Arial; font-size: 16px; font-style: normal; font-variant-caps: normal; font-weight: 400; letter-spacing: normal; orphans: auto; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; widows: auto; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration: none;"><span style="caret-color: rgb(0, 0, 0); color: rgb(0, 0, 0); font-family: Arial; font-size: 16px; font-style: normal; font-variant-caps: normal; font-weight: 400; letter-spacing: normal; orphans: auto; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; widows: auto; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration: none; display: inline !important; float: none;">Leonid.</span>

</div>
<div><br><blockquote type="cite"><div>On Nov 18, 2025, at 16:50, Jennifer Ganger <jennifer.ganger@gmail.com> wrote:</div><br class="Apple-interchange-newline"><div>Hello again,<div>Some of my students pointed out today that they are getting different MLU results when they run it within the browser versus in CLAN. The effect seems to be widespread--not just one corpus. They noticed discrepancies with the Tardif corpus at first but then found more.</div><div><br></div><div>Taking Eve (Brown corpus) file 020000a in the browser as an example, the command</div><div>mlu +t*CHI  020000a.cha yields:</div><div><span style="box-sizing: border-box; font-family: "Courier New", Courier, monospace; background-color: rgb(245, 245, 245);">From file <childes/Eng-NA/Brown/Eve/020000a.cha>
MLU for Speaker: *CHI:
  MLU (xxx, yyy and www are EXCLUDED from the utterance and morpheme counts): </span></div><div><span style="box-sizing: border-box; font-family: "Courier New", Courier, monospace; background-color: rgb(245, 245, 245);">Number of: utterances = 424, morphemes = </span><span style="box-sizing: border-box; font-family: "Courier New", Courier, monospace; background-color: yellow;">3687 </span></div><div><span style="box-sizing: border-box; font-family: "Courier New", Courier, monospace; background-color: rgb(245, 245, 245);">Ratio of morphemes over utterances = </span><span style="box-sizing: border-box; font-family: "Courier New", Courier, monospace; background-color: yellow;">8.696 </span></div><div><span style="box-sizing: border-box; font-family: "Courier New", Courier, monospace; background-color: rgb(245, 245, 245);">Standard deviation = 5.953</span></div><div><br></div><div><div>That can't be correct. </div><div><br></div><div>In downloaded transcripts using CLAN, the same command yields:</div><div><font face="Courier New">From file <C:\talkbank\clan\Brown\Eve\020000a.cha></font></div><div><font face="Courier New">MLU for Speaker: *CHI:<br>  MLU (xxx, yyy and www are EXCLUDED from the utterance and morpheme counts):<br><span style="white-space: pre;"> </span>Number of: utterances = 424, morphemes = <span style="background-color: yellow;">1468</span><br><span style="white-space: pre;">       </span>Ratio of morphemes over utterances = <span style="background-color: yellow;">3.462</span><br><span style="white-space: pre;">  </span>Standard deviation = 1.975</font></div></div><div><br></div><div>Any advice would be appreciated.</div><div><br></div><div>Thanks,</div><div>Jenny</div><div><br></div><div><br></div><div><br class="webkit-block-placeholder"></div>

-- <br>
You received this message because you are subscribed to the Google Groups "chibolts" group.<br>
To unsubscribe from this group and stop receiving emails from it, send an email to <a href="mailto:chibolts+unsubscribe@googlegroups.com">chibolts+unsubscribe@googlegroups.com</a>.<br>
To view this discussion visit <a href="https://groups.google.com/d/msgid/chibolts/cafe4c39-c9f5-44d6-aae3-3d547b810828n%40googlegroups.com?utm_medium=email&utm_source=footer">https://groups.google.com/d/msgid/chibolts/cafe4c39-c9f5-44d6-aae3-3d547b810828n%40googlegroups.com</a>.<br>
</div></blockquote></div><br></div>

<p></p>

-- <br>
You received this message because you are subscribed to a topic in the Google Groups "chibolts" group.<br>
To unsubscribe from this topic, visit <a href="https://groups.google.com/d/topic/chibolts/PYaO-3L2CPo/unsubscribe">https://groups.google.com/d/topic/chibolts/PYaO-3L2CPo/unsubscribe</a>.<br>
To unsubscribe from this group and all its topics, send an email to <a href="mailto:chibolts+unsubscribe@googlegroups.com">chibolts+unsubscribe@googlegroups.com</a>.<br>
To view this discussion visit <a href="https://groups.google.com/d/msgid/chibolts/294F4F51-1045-4F50-A70C-4798DAFA2D84%40andrew.cmu.edu?utm_medium=email&utm_source=footer">https://groups.google.com/d/msgid/chibolts/294F4F51-1045-4F50-A70C-4798DAFA2D84%40andrew.cmu.edu</a>.<br>
</div></blockquote></body></html>

<p></p>

-- <br />
You received this message because you are subscribed to the Google Groups "chibolts" group.<br />
To unsubscribe from this group and stop receiving emails from it, send an email to <a href="mailto:chibolts+unsubscribe@googlegroups.com">chibolts+unsubscribe@googlegroups.com</a>.<br />
To view this discussion visit <a href="https://groups.google.com/d/msgid/chibolts/309087C8-BDE8-4B75-89A6-074BA46087F8%40gmail.com?utm_medium=email&utm_source=footer">https://groups.google.com/d/msgid/chibolts/309087C8-BDE8-4B75-89A6-074BA46087F8%40gmail.com</a>.<br />