<br><div class="gmail_quote">On Mon, Mar 15, 2010 at 7:41 AM, John F. Sowa <span dir="ltr"><<a href="mailto:sowa@bestweb.net">sowa@bestweb.net</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex;">
<div class="im">> Clearly the massive amount of English training data has certain<br>
> extremely unfortunate consequences for the choice of lexical items.<br>
> It is amusing, but could be potentially very confusing, when one<br></div>
> currency is translated to another (but not recalculated!).,,<div class="im"><br>
><br>
> Olje koster kr 800 fatet. Gassen koster NOK 400 mens vindkraft<br>
> koster seksti kroner.<br>
><br>
> Oil costs U.S. $ 800 per barrel. The gas costs NOK 400, while<br>
> wind power costs sixty kroner.<br>
<br></div>
That is an example where some rule-based processing should be<br>
added as a supplement to statistical methods.  It could recognize<br>
pairs of (unit, value) and either translate both or leave both<br>
unchanged.<br>
<br>
Wolfram's Alpha system (which is used in Microsoft's Bing) can<br>
handle such examples.  I typed "What is 400 NOK in dollars?"<br>
to Bing.com and got the answer<br>
<br>
   400 NOK = 68.38800 USD<br>
<br></blockquote><div><br></div><div>I'm not sure that this is related to Bing's translation system, though. While Google's translator mangled this example, Google search handles it just fine (although they seem to be using a slightly different exchange rate):</div>
<div><br></div><div><span class="Apple-style-span" style="font-family: arial, sans-serif; font-size: 18px; white-space: nowrap; -webkit-border-horizontal-spacing: 2px; -webkit-border-vertical-spacing: 2px; "><b>400 Norwegian kroner = 68.6024 U.S. dollars</b></span></div>
<div><br></div><div><br></div><div>Eric Rochester</div><div><br></div><div><br></div></div>