It seems to me that OpenNLP project has a free tokenizer too.<br><br><a href="http://opennlp.sourceforge.net/">http://opennlp.sourceforge.net/</a><br><br>Regards,<br><br>Carlos Menezes<br><br><div class="gmail_quote">2008/11/20 Kevin B. Cohen <span dir="ltr"><<a href="mailto:kevin.cohen@gmail.com">kevin.cohen@gmail.com</a>></span><br>
<blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">Samira,<br>
<br>
See Alias-I's LingPipe for pretty much anything you might ever need:<br>
<br>
<a href="http://alias-i.com/lingpipe/" target="_blank">http://alias-i.com/lingpipe/</a><br>
<br>
Kev<br>
<div><div></div><div class="Wj3C7c"><br>
On 11/20/08, ben dbabis samira <<a href="mailto:bendbabis_samira@yahoo.fr">bendbabis_samira@yahoo.fr</a>> wrote:<br>
><br>
> Hi,<br>
> Does anyone knows references of free tokenizers implemented with Java for<br>
> english texts?<br>
> Thanks for help<br>
><br>
> Samira BEN DBABIS<br>
> PHD student<br>
> MIRACL Laboratory<br>
> Sfax, TUNISIA<br>
><br>
><br>
</div></div>> _______________________________________________<br>
>  Corpora mailing list<br>
>  <a href="mailto:Corpora@uib.no">Corpora@uib.no</a><br>
>  <a href="http://mailman.uib.no/listinfo/corpora" target="_blank">http://mailman.uib.no/listinfo/corpora</a><br>
><br>
><br>
<br>
<br>
--<br>
K. B. Cohen<br>
Biomedical Text Mining Group Lead, Center for Computational Pharmacology<br>
and<br>
Lead Artificial Intelligence Engineer, The MITRE Corporation, Human<br>
Language Technology Division<br>
303-916-2417 (cell) 303-377-9194 (home)<br>
<a href="http://compbio.uchsc.edu/Hunter_lab/Cohen" target="_blank">http://compbio.uchsc.edu/Hunter_lab/Cohen</a><br>
<br>
_______________________________________________<br>
Corpora mailing list<br>
<a href="mailto:Corpora@uib.no">Corpora@uib.no</a><br>
<a href="http://mailman.uib.no/listinfo/corpora" target="_blank">http://mailman.uib.no/listinfo/corpora</a><br>
</blockquote></div><br>