Thanks so much for your helps.<br><br>I will try tools you suggested.<br><br>Best,<br>Pham<br><br><div class="gmail_quote">2011/5/13 RadimRehurek <span dir="ltr"><<a href="mailto:RadimRehurek@seznam.cz">RadimRehurek@seznam.cz</a>></span><br>
<blockquote class="gmail_quote" style="margin: 0pt 0pt 0pt 0.8ex; border-left: 1px solid rgb(204, 204, 204); padding-left: 1ex;">+1 on Semantic Vectors, or, if you prefer Python over Java, people have also used gensim for large scale Random Projections/LSA/LDA similarity stuff:<br>

<br>
<a href="http://nlp.fi.muni.cz/projekty/gensim/" target="_blank">http://nlp.fi.muni.cz/projekty/gensim/</a><br>
<br>
Best,<br>
Radim<br>
<br>
<br>
> ------------ Původní zpráva ------------<br>
> Od: Dominic Widdows <<a href="mailto:widdows@google.com">widdows@google.com</a>><br>
> Předmět: Re: [Corpora-List] Word similarity from large text corpus<br>
> Datum: 13.5.2011 13:56:15<br>
> ----------------------------------------<br>
<div><div></div><div class="h5">> Dear Pham,<br>
><br>
> Semantic vectors covers a lot of options, and people seem to have a<br>
> reasonably productive and pain-free time using it.<br>
> <a href="http://code.google.com/p/semanticvectors/" target="_blank">http://code.google.com/p/semanticvectors/</a><br>
><br>
> Best wishes,<br>
> Dominic<br>
><br>
> On Fri, May 13, 2011 at 3:15 AM, Marco Baroni <<a href="mailto:marco.baroni@unitn.it">marco.baroni@unitn.it</a>> wrote:<br>
> > Dear Pham,<br>
> ><br>
> > There is also a list of pre-compiled similarities (and tools to extract a<br>
> > similar list from your own frequency table) here:<br>
> ><br>
> > <a href="http://clic.cimec.unitn.it/dm/" target="_blank">http://clic.cimec.unitn.it/dm/</a><br>
> ><br>
> > (for the pre-compiled list, look at the "Top 10 nearest neighbours of each<br>
> > word in TypeDM" section.)<br>
> ><br>
> > Regards,<br>
> ><br>
> > Marco<br>
> ><br>
> ><br>
> > --<br>
> > Marco Baroni<br>
> > Center for Mind/Brain Sciences (CIMeC)<br>
> > University of Trento<br>
> > <a href="http://clic.cimec.unitn.it/marco" target="_blank">http://clic.cimec.unitn.it/marco</a><br>
> ><br>
> > _______________________________________________<br>
> > UNSUBSCRIBE from this page: <a href="http://mailman.uib.no/options/corpora" target="_blank">http://mailman.uib.no/options/corpora</a><br>
> > Corpora mailing list<br>
> > <a href="mailto:Corpora@uib.no">Corpora@uib.no</a><br>
> > <a href="http://mailman.uib.no/listinfo/corpora" target="_blank">http://mailman.uib.no/listinfo/corpora</a><br>
> ><br>
><br>
> _______________________________________________<br>
> UNSUBSCRIBE from this page: <a href="http://mailman.uib.no/options/corpora" target="_blank">http://mailman.uib.no/options/corpora</a><br>
> Corpora mailing list<br>
> <a href="mailto:Corpora@uib.no">Corpora@uib.no</a><br>
> <a href="http://mailman.uib.no/listinfo/corpora" target="_blank">http://mailman.uib.no/listinfo/corpora</a><br>
><br>
><br>
><br>
<br>
_______________________________________________<br>
UNSUBSCRIBE from this page: <a href="http://mailman.uib.no/options/corpora" target="_blank">http://mailman.uib.no/options/corpora</a><br>
Corpora mailing list<br>
<a href="mailto:Corpora@uib.no">Corpora@uib.no</a><br>
<a href="http://mailman.uib.no/listinfo/corpora" target="_blank">http://mailman.uib.no/listinfo/corpora</a><br>
</div></div></blockquote></div><br><br clear="all"><br>-- <br>Pham Quang Nhat Minh (Mr)<br>PhD student<br>NLP Laboratory - School of Information Science - JAIST<br>1-1 Asahidai, Nomi, 923-1292 Japan<br>Email: <a href="mailto:minhpqn@jaist.ac.jp">minhpqn@jaist.ac.jp</a><br>
Web: <a href="http://www.jaist.ac.jp/index-e.html">http://www.jaist.ac.jp/index-e.html</a><br>Phone: (+81) 090-9440-1556<br><br>