<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
<html>
<head>
  <meta content="text/html;charset=ISO-8859-1" http-equiv="Content-Type">
</head>
<body bgcolor="#ffffff" text="#000000">
Hi Li-chin,<br>
<br>
As you probably know, Wordsmith accepts UTF-8 encoded texts, so would
that be an option for you? Then you shouldn't have the trouble with odd
characters. Else you might like opening your texts in Microsoft Word or
some other text editor (e.g., vim, emacs, etc.) and convert the format
to UTF-8 or ASCII. It would be possible to write a perl or php script
that would quickly and easily convert your texts. (the appropriate
utf-8 to ascii function in php is utf8_decode($string) and is provided
by the xml extension)<br>
<br>
Hth,<br>
<br>
Klaus<br>
<br>
Klaus Guenther<br>
University of Freiburg, Germany<br>
<br>
On 5/28/2005 10:23 PM, sara chen spake the following words:
<blockquote
 cite="mid20050528202335.43203.qmail@web33013.mail.mud.yahoo.com"
 type="cite">
  <div>Hi Klaus,</div>
  <div> </div>
  <div>Thank you very much for your prompt reply!</div>
  <div> </div>
  <div>Unfortunately, my data are not tagged and I'm not planning to do
so unless it's necessary. And then, any way I can tag my data
automatically, in order to locate those " ? " ?</div>
  <div> </div>
  <div>Ok, some concordance lines actually don't include any " ? " ,
and " ' " in original data becomes " ? " so they appear in the result
of my searching. Of course, there are accurate concordance lines, but I
need to pick them out mannually. Weird!</div>
  <div> </div>
  <div>Li-chin</div>
  <div> </div>
  <div><br>
  <br>
  <b><i>Klaus Guenther <a class="moz-txt-link-rfc2396E" href="mailto:klaus@capitalfocus.org"><klaus@capitalfocus.org></a></i></b> wrote:</div>
  <blockquote class="replbq"
 style="border-left: 2px solid rgb(16, 16, 255); padding-left: 5px; margin-left: 5px;">Hi
Li-chin,<br>
    <br>
What would the character encoding be? And what special characters?<br>
    <br>
If your original data is tagged, you should be able to search for the
question mark tag. I've not had that much trouble doing what I needed
to do. (The only exception was that it doesn't offer regular expression
support...)<br>
    <br>
Klaus<br>
    <br>
On 5/28/2005 8:59 PM, sara chen spake the following words:
    <blockquote
 cite="mid20050528185934.90760.qmail@web33005.mail.mud.yahoo.com"
 type="cite">
      <div>Hi everyone,</div>
      <div> </div>
      <div>I'm wonder if any WordSmith expert can help me to solve few
questions.</div>
      <div> </div>
      <div>1) How to avoid producing those strange codes when
transferring my original text data into the txt. files, which is
recognized by WordSmith? I have copied the origninal text on Notepad
and then save it as txt file.</div>
      <div> </div>
      <div>2) How to search question mark "?" from my data with
WordSmith? I used concorrdance to search them but some strange codes
came out. </div>
      <div> </div>
      <div>Many thanks</div>
      <div> </div>
      <div>Li-chin</div>
      <div> </div>
      <div> </div>
      <hr size="1">
Do You Yahoo!?<br>
Yahoo! Small Business - <a
 href="http://us.rd.yahoo.com/evt=31637/*http://smallbusiness.yahoo.com/resources/">Try
our new Resources site!</a> </blockquote>
    <br>
  </blockquote>
  <p> </p>
  <hr size="1">Do You Yahoo!?<br>
Yahoo! Small Business - <a
 href="http://us.rd.yahoo.com/evt=31637/*http://smallbusiness.yahoo.com/resources/">Try
our new Resources site!</a>
</blockquote>
<br>
</body>
</html>