<div dir="ltr">Hello,<br><div class="gmail_extra"><br><div class="gmail_quote">On Fri, Nov 14, 2014 at 6:21 PM, Valerio Basile <span dir="ltr"><<a href="mailto:v.basile@rug.nl" target="_blank">v.basile@rug.nl</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div dir="ltr"><span class="">> is any of you aware of a language identification tool that covers at least the EU official languages.<br>> Preferably a stand alone application.<br><br></span>I'd like to throw in TextCat:<br><div><br></div><div style>  <span style="width:228px;height:16px" tabindex="0" class=""></span><span style="width:228px;height:16px" tabindex="0" class=""></span><span style="width:228px;height:16px" tabindex="0" class="watilin-mask"></span><a tabindex="-1" href="http://odur.let.rug.nl/~vannoord/TextCat/" target="_blank">http://odur.let.rug.nl/~vannoord/TextCat/</a><br></div><div><br></div><div>It's a Perl script, and it supports 76 languages, the complete list is on the website.</div></div>
<br></blockquote><div><br></div><div>You can try out Textcat and the Compact Language Detector 2 online on <br><a href="http://elizia.net/languageDetector/">http://elizia.net/languageDetector/</a> <br>and compare it to a simple Python script that I have written, the languageDetector, based on unicode character identification and trigrams.<br><br></div><div>best<br>kim<br>--<br><a href="http://gerdes.fr">gerdes.fr</a><br></div><div><br> </div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">_______________________________________________<br>
UNSUBSCRIBE from this page: <a href="http://mailman.uib.no/options/corpora" target="_blank">http://mailman.uib.no/options/corpora</a><br>
Corpora mailing list<br>
<a href="mailto:Corpora@uib.no">Corpora@uib.no</a><br>
<span style="width:208px;height:16px" tabindex="0" class="watilin-mask"></span><a tabindex="-1" href="http://mailman.uib.no/listinfo/corpora" target="_blank">http://mailman.uib.no/listinfo/corpora</a><br>
<br></blockquote></div><br></div></div>