<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN">
<HTML><HEAD>
<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=iso-8859-1">


<META content="MSHTML 5.50.4207.2601" name=GENERATOR>
<STYLE></STYLE>
</HEAD>
<BODY bgColor=#ffffff>
<DIV><SPAN class=187450315-16102000><FONT face=Arial color=#0000ff size=2>Andrew
McCallum's Bag Of Words library has several components that sound like they
would be of use to you.  </FONT></SPAN></DIV>
<DIV><FONT face=Arial color=#0000ff size=2></FONT> </DIV>
<DIV><FONT face=Arial color=#0000ff size=2><A
href="http://www.cs.cmu.edu/~mccallum/bow">http://www.cs.cmu.edu/~mccallum/bow</A></FONT></DIV>
<DIV><FONT face=Arial color=#0000ff size=2></FONT> </DIV>
<DIV><SPAN class=187450315-16102000><FONT face=Arial color=#0000ff
size=2>Regards</FONT></SPAN></DIV>
<DIV><SPAN class=187450315-16102000><FONT face=Arial color=#0000ff
size=2>Paul.</FONT></SPAN></DIV>
<P><FONT face=Arial size=2>---</FONT> <BR><FONT face=Arial size=2>Paul
Holmes-Higgin</FONT> <BR><FONT face=Arial size=2>Documentum UK</FONT> <BR><FONT
face=Arial size=2>Tel: +44 (0)20 8867 3179</FONT> <BR><FONT face=Arial
size=2>Email: paulhh@documentum.com</FONT> </P>
<BLOCKQUOTE dir=ltr style="MARGIN-RIGHT: 0px">
  <DIV class=OutlookMessageHeader dir=ltr align=left><FONT face=Tahoma
  size=2>-----Original Message-----<BR><B>From:</B> Patrick Ruch
  [mailto:ruch@dim.hcuge.ch]<BR><B>Sent:</B> Monday, October 16, 2000 3:32
  PM<BR><B>To:</B> ln@cines.fr; Elsnet; IRList; webir@egroups.com;
  CORPORA@HD.UIB.NO<BR><B>Subject:</B> Corpora: IR info and
  tools<BR><BR></FONT></DIV>
  <DIV><FONT face=Arial size=2>Hi,</FONT></DIV>
  <DIV><FONT face=Arial color=#0000ff size=2></FONT> </DIV>
  <DIV><FONT face=Arial size=2>I am looking for a toolset -free or commercial-
  for calculating</FONT></DIV>
  <DIV><FONT face=Arial size=2>vector distances (cosinus, euclid...). The target
  is an NLP-based</FONT></DIV>
  <DIV><FONT face=Arial size=2>IR engine, and it must be efficient.
  Related stategies for choosing</FONT></DIV>
  <DIV><FONT face=Arial size=2>the indexing terms</FONT><FONT face=Arial size=2>
  are</FONT><FONT face=Arial size=2> welcome.</FONT></DIV>
  <DIV> </DIV>
  <DIV><FONT face=Arial size=2>Thanks in advance,</FONT></DIV>
  <DIV><FONT face=Arial size=2>Patrick Ruch</FONT></DIV>
  <DIV> </DIV>
  <DIV><FONT face=Arial size=2>__________________________________<BR>Patrick
  Ruch<BR>HUG - Medical Informatics Division<BR>CH-1211 Geneva 14<BR>tel.: (+41
  22) 372 61 64<BR>fax: (+41 22) 372 48 55<BR>email: <A
  href="mailto:Patrick.Ruch@dim.hcuge.ch">Patrick.Ruch@dim.hcuge.ch</A></FONT></DIV></BLOCKQUOTE></BODY></HTML>