<div class="gmail_quote">2011/6/29 Mike Scott <span dir="ltr"><<a href="mailto:mike@lexically.net" target="_blank">mike@lexically.net</a>></span><br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">


<u></u>

  
    
    
  
  <div bgcolor="#ffffff" text="#000000">
    Depends who's doing the plumbing, really. In WordSmith there is a
    converter which will do that already, but Chasen is a different
    piece of kit and I think you need a Japanese plumber for that.!<br><font color="#888888">
    Mike</font><div><div></div><div><br>
    
</div></div><div>
  </div></div>

</blockquote></div><br>It appears that there might be a way to get Chasen to output UTF-16. But it looks a little complicated and involves creating UTF-16 versions of the grammar and dictionary files. The only encodings supported in the default setup are  EUC-JP (for Linux) and Shift_JIS (for Windows), with some options to get ISO-8859-1 and UTF-8 encodings.<br>


<br>The information is here (again in Japanese):<br><a href="http://chasen-legacy.sourceforge.jp/" target="_blank">http://chasen-legacy.sourceforge.jp/</a><br><br>Laurence.<br>