<html><head></head><body style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space; "> Lulu,<div><br></div><div><span class="Apple-tab-span" style="white-space:pre">      </span>It sounds like your data is not encoded in UTF8 Unicode format. Do your data files look OK when you open them with CLAN editor? If not, then you need to  converted your data files to UTF8 encoding. You can use cp2utf command in CLAN to do the conversion. If you need more help with this, then please email directly to me, not to chibolts, one data file as an attachment to email message and let me know which CLAN command(s) are you using to analyze your data.</div><div><div>
<span class="Apple-style-span" style="border-collapse: separate; color: rgb(0, 0, 0); font-family: Helvetica; font-size: medium; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: normal; orphans: 2; text-align: auto; text-indent: 0px; text-transform: none; white-space: normal; widows: 2; word-spacing: 0px; -webkit-border-horizontal-spacing: 0px; -webkit-border-vertical-spacing: 0px; -webkit-text-decorations-in-effect: none; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px; "><span class="Apple-style-span" style="border-collapse: separate; color: rgb(0, 0, 0); font-family: Helvetica; font-size: medium; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: normal; orphans: 2; text-indent: 0px; text-transform: none; white-space: normal; widows: 2; word-spacing: 0px; -webkit-border-horizontal-spacing: 0px; -webkit-border-vertical-spacing: 0px; -webkit-text-decorations-in-effect: none; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px; "><div style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space; "><span class="Apple-style-span" style="border-collapse: separate; color: rgb(0, 0, 0); font-family: Helvetica; font-size: medium; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: normal; orphans: 2; text-indent: 0px; text-transform: none; white-space: normal; widows: 2; word-spacing: 0px; -webkit-border-horizontal-spacing: 0px; -webkit-border-vertical-spacing: 0px; -webkit-text-decorations-in-effect: none; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px; "><div style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space; "><div><br class="Apple-interchange-newline">Leonid.</div><div><br></div></div></span><br class="Apple-interchange-newline"></div></span><br class="Apple-interchange-newline"></span><br class="Apple-interchange-newline">
</div>
<br><div><div>On Oct 8, 2010, at 11:42, Lulu Song wrote:</div><br class="Apple-interchange-newline"><blockquote type="cite">Hi!<br><br>We are trying to get a count of the types and tokens from transcripts in Chinese. When transcribing, spaces were inserted at the word boundaries. So now we can actually count the words using CLAN. The problem is that the word list in the output file is gibberish as if there is some encoding issue, even though the total type and token counts appear correct. Is there a way to get the word list to display properly?<br>
<br>Any help is appreciated!<br><br>Lulu Song<br clear="all"><br>-- <br>宋露露 Lulu Song, Ph.D.<br>Postdoctoral Fellow<br>New York University<br>The Center for Research on Culture, Development, and Education<br>246 Greene Street 517E<br>
New York, NY 10003<br>Phone: 212-998-5822  Fax: 212-995-3918 <br>Web page: <a href="https://files.nyu.edu/ls166/public/">https://files.nyu.edu/ls166/public/</a><br><div><br class="webkit-block-placeholder"></div>

-- <br>
You received this message because you are subscribed to the Google Groups "chibolts" group.<br>
To post to this group, send email to <a href="mailto:chibolts@googlegroups.com">chibolts@googlegroups.com</a>.<br>
To unsubscribe from this group, send email to <a href="mailto:chibolts+unsubscribe@googlegroups.com">chibolts+unsubscribe@googlegroups.com</a>.<br>

For more options, visit this group at <a href="http://groups.google.com/group/chibolts?hl=en">http://groups.google.com/group/chibolts?hl=en</a>.<br>


</blockquote></div><br></div></body></html>

<p></p>

-- <br />
You received this message because you are subscribed to the Google Groups "chibolts" group.<br />
To post to this group, send email to chibolts@googlegroups.com.<br />
To unsubscribe from this group, send email to chibolts+unsubscribe@googlegroups.com.<br />

For more options, visit this group at http://groups.google.com/group/chibolts?hl=en.<br />