<div dir="ltr"><div class="gmail_default" style="font-size:small;color:rgb(51,51,153)">Dear Leonid,<br><br>Thank you so much for your prompt and very helpful reply! Wish you a happy new year!<br><br></div><div class="gmail_default" style="font-size:small;color:rgb(51,51,153)">

Best wishes!<br></div><div class="gmail_default" style="font-size:small;color:rgb(51,51,153)">Ying <br></div></div><div class="gmail_extra"><br><br><div class="gmail_quote">On Tue, Dec 31, 2013 at 7:17 AM, Leonid Spektor <span dir="ltr"><<a href="mailto:spektor@andrew.cmu.edu" target="_blank">spektor@andrew.cmu.edu</a>></span> wrote:<br>

<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div style="word-wrap:break-word">Dear Ying,<div><br></div><div><span style="white-space:pre-wrap">    </span>First I would suggest that you use +/-s" [- zho]" option with both MOR and POST commands:</div>

<div class="im"><div><br></div><div>mor +s"[- zho]" sample_English.cha +1</div></div><div>post +s"[- zho]" sample_English.cha +1</div><div class="im"><div>mor -s"[- zho]" sample_English.cha +1</div>

</div><div>post -s"[- zho]" sample_English.cha +1</div><div><br></div><div><br></div><div>Here are answers to your questions:</div><div><br></div><div>1. You can fix errors in any order you like, as long as in the end CHECK reports no errors found. If you are using ESC-L CHECK, then you will not have a choice of ignoring the first error found, because ESC-L CHECK always starts from the top of the file. It has no continue from current location option.</div>

<div><br></div><div>2. if you use "park@s" instead of "park@s$n", then MLU will give correct result.</div><div>The TTR results could be wrong depending on your FREQ command. If you only run FREQ with +s"[- zho]" or</div>

<div>-s"[- zho]" options, then result will be correct with either "park@s" or "park@s$n" choice. If you run FREQ without</div><div>+/-s"[- zho]" options, then you will force FREQ to compare words, for example, "park@s" and "park", which are not same, and it will inflate the TTR result. If you use "park@s$n" choice and run FREQ on %mor tier, i.e use "+t%mor -t*" options, then result will be more accurate.</div>

<div><br></div><div>3. Your sample file had "[*tense]" instead of "[* tense]" code, notice missing space character. Maybe that was the cause for failure to find "[* tense]" code. I have added the space character and got correct result searching for "[* tense]" code with this command:</div>

<div><br></div><div>freq +s"[* tense]" sample_English.cha</div><div><br></div><div>If you want to count the actual words associated with code "[* tense]", then use this command:</div><div><br></div><div>

freq +s"<* tense>" sample_English.cha</div><div><br></div><div><br></div><div>I hope this helps and Happy New Year!</div><div><br><div>
<span style="border-collapse:separate;border-spacing:0px"><span style="line-height:normal;text-indent:0px;border-collapse:separate;letter-spacing:normal;font-variant:normal;text-transform:none;font-style:normal;white-space:normal;font-family:'Lucida Grande';font-weight:normal;word-spacing:0px"><div style="word-wrap:break-word">

<span style="line-height:normal;text-indent:0px;border-collapse:separate;letter-spacing:normal;font-variant:normal;text-transform:none;font-style:normal;white-space:normal;font-family:'Lucida Grande';font-weight:normal;word-spacing:0px"><div style="word-wrap:break-word">

<span style="line-height:normal;text-indent:0px;border-collapse:separate;letter-spacing:normal;font-variant:normal;text-transform:none;font-style:normal;white-space:normal;font-family:Helvetica;font-weight:normal;word-spacing:0px"><span style="line-height:normal;text-indent:0px;border-collapse:separate;letter-spacing:normal;font-variant:normal;text-transform:none;font-style:normal;white-space:normal;font-family:Helvetica;font-weight:normal;word-spacing:0px"><div style="word-wrap:break-word">

<span style="line-height:normal;text-indent:0px;border-collapse:separate;letter-spacing:normal;font-variant:normal;text-transform:none;font-style:normal;white-space:normal;font-family:Helvetica;font-weight:normal;word-spacing:0px"><div style="word-wrap:break-word">

<div><br>Leonid.</div><div><br></div></div></span></div></span></span></div></span></div></span></span><br>
</div>
<br><div><div><div class="h5"><div>On Dec 30, 2013, at 18:46 , Ying <<a href="mailto:yl5834@gmail.com" target="_blank">yl5834@gmail.com</a>> wrote:</div><br></div></div><blockquote type="cite"><div><div class="h5">

<div dir="ltr">Dear Leonid,<br><br>I want to get MLU, the number of different words, and also TTR from some Mandarin(Putonghua)-English bilingual narrative data. Also I added some word and utterance level codes and want to summarize the codes. For example, for the following sample (I am attaching the transcript after running the commands),<br>

<br>*CHI: [- zho] 我 去 了 一 个 <一个> [/]  park@s yesterday@s. [+ CS]<br>*CHI: It is a very big one.<br>*EXA: Nice.<br>*CHI: My mom say [* tense] “We will come from time to time”. [+ GE]<br>Note: <br>The precode [- zho] is for Mandarin/Putonghua, as [- yue] is for Cantonese<br>

[+ CS] is an utterance level code, indicating code-switched sentences<br>[+ GE] is an utterance level code, indicating sentences with grammatical errors<br>[* tense] is a word level code, indicating a tense error<br><br>
Here are the commands I used:<br>
mor +s"[- zho]" sample_English.cha +1<br>post sample_English.cha +1<br>mor -s"[- zho]" sample_English.cha +1<br>post sample_English.cha +1<br>Esc_L<br>freq +s"[% *]" *.cha<br><br>Questions I have:<br>

(1) May I ignore an error and move to the next one when I run CHECK?<br>(2) for code-switched words within an utterance, I don't care for mor info such as noun or verb. But I do want to calculate MLU and TTR. If I go with park@s but don't bother to make park@s$n, will CLAN give me the correct results? <br>

(3) I can get codes [zho], [CS], and [GE] calculated using FREQ, but not [* tense]. How may I count the occurance of [* tense]. Moreover, can I know whether it is the same verb (e.g., say) coded [* tense]?<br><br>Thank you very much! <br>

Happy New Year!<br><br>Sincerely,<br>Ying<br><br></div><div><br></div>

-- <br>
You received this message because you are subscribed to the Google Groups "chibolts" group.<br>
To unsubscribe from this group and stop receiving emails from it, send an email to <a href="mailto:chibolts+unsubscribe@googlegroups.com" target="_blank">chibolts+unsubscribe@googlegroups.com</a>.<br>
To post to this group, send email to <a href="mailto:chibolts@googlegroups.com" target="_blank">chibolts@googlegroups.com</a>.<br>
To view this discussion on the web visit <a href="https://groups.google.com/d/msgid/chibolts/6de36ec6-5c23-41d7-a0b5-06f5b35a5ce2%40googlegroups.com" target="_blank">https://groups.google.com/d/msgid/chibolts/6de36ec6-5c23-41d7-a0b5-06f5b35a5ce2%40googlegroups.com</a>.<br>


For more options, visit <a href="https://groups.google.com/groups/opt_out" target="_blank">https://groups.google.com/groups/opt_out</a>.<br>
</div></div><span><sample_English.cha></span></blockquote></div><br></div></div><div class="im">

<p></p>

-- <br>
You received this message because you are subscribed to the Google Groups "chibolts" group.<br>
To unsubscribe from this group and stop receiving emails from it, send an email to <a href="mailto:chibolts%2Bunsubscribe@googlegroups.com" target="_blank">chibolts+unsubscribe@googlegroups.com</a>.<br>
To post to this group, send email to <a href="mailto:chibolts@googlegroups.com" target="_blank">chibolts@googlegroups.com</a>.<br></div>
To view this discussion on the web visit <a href="https://groups.google.com/d/msgid/chibolts/DBB212D9-F6B5-497A-A88B-2E563A04C7F4%40andrew.cmu.edu" target="_blank">https://groups.google.com/d/msgid/chibolts/DBB212D9-F6B5-497A-A88B-2E563A04C7F4%40andrew.cmu.edu</a>.<div class="HOEnZb">

<div class="h5"><br>
For more options, visit <a href="https://groups.google.com/groups/opt_out" target="_blank">https://groups.google.com/groups/opt_out</a>.<br>
</div></div></blockquote></div><br></div>

<p></p>

-- <br />
You received this message because you are subscribed to the Google Groups "chibolts" group.<br />
To unsubscribe from this group and stop receiving emails from it, send an email to chibolts+unsubscribe@googlegroups.com.<br />
To post to this group, send email to chibolts@googlegroups.com.<br />
To view this discussion on the web visit <a href="https://groups.google.com/d/msgid/chibolts/CACApr0HG_0o-1Qm90ERZETdASbL%2B%2BexmddgVVJCptyWHr_OCkg%40mail.gmail.com">https://groups.google.com/d/msgid/chibolts/CACApr0HG_0o-1Qm90ERZETdASbL%2B%2BexmddgVVJCptyWHr_OCkg%40mail.gmail.com</a>.<br />
For more options, visit <a href="https://groups.google.com/groups/opt_out">https://groups.google.com/groups/opt_out</a>.<br />