<HTML><BODY style="word-wrap: break-word; -khtml-nbsp-mode: space; -khtml-line-break: after-white-space; "><BR><DIV><DIV>Maria Esteva kirjoitti 10. jan. 2007 kello 22.02:</DIV><BR class="Apple-interchange-newline"><BLOCKQUOTE type="cite"><DIV style="margin-top: 0px; margin-right: 0px; margin-bottom: 0px; margin-left: 0px; ">Dear all,</DIV><DIV style="margin-top: 0px; margin-right: 0px; margin-bottom: 0px; margin-left: 0px; min-height: 14px; "><BR></DIV><DIV style="margin-top: 0px; margin-right: 0px; margin-bottom: 0px; margin-left: 0px; ">I am wondering if somebody knows of a program that will recognize and sort large sets of files according to language. </DIV></BLOCKQUOTE><BR></DIV><DIV>My experience is that a file certainly may contain different languages. For our work, we identify language down to the paragraph level, although we would often like to be as fine-grained as sentence level.</DIV><DIV><BR class="khtml-block-placeholder"></DIV><DIV>We use text_cat, cf.</DIV><DIV><A href="http://www.let.rug.nl/~vannoord/TextCat/">http://www.let.rug.nl/~vannoord/TextCat/</A></DIV><DIV>and have very good experiences.</DIV><DIV><BR class="khtml-block-placeholder"></DIV><DIV>Trond.</DIV><BR><DIV> <P style="margin-top: 0px; margin-right: 0px; margin-bottom: 0px; margin-left: 0px; font: normal normal normal 10px/normal Monaco; ">----------------------------------------------------------------------</P><P style="margin-top: 0px; margin-right: 0px; margin-bottom: 0px; margin-left: 0px; font: normal normal normal 10px/normal Monaco; ">Trond Trosterud                                        t +47 7764 4763</P><P style="margin-top: 0px; margin-right: 0px; margin-bottom: 0px; margin-left: 0px; font: normal normal normal 10px/normal Monaco; ">Institutt for språkvitskap, Det humanistiske fakultet  m +47 950 70140</P><P style="margin-top: 0px; margin-right: 0px; margin-bottom: 0px; margin-left: 0px; font: normal normal normal 10px/normal Monaco; ">N-9037 Universitetet i Tromsø, Noreg                   f +47 7764 5216</P><P style="margin-top: 0px; margin-right: 0px; margin-bottom: 0px; margin-left: 0px; font: normal normal normal 10px/normal Monaco; ">Trond.Trosterud (a) hum.uit.no          <A href="http://www.hum.uit.no/a/trond/">http://www.hum.uit.no/a/trond/</A></P><P style="margin-top: 0px; margin-right: 0px; margin-bottom: 0px; margin-left: 0px; font: normal normal normal 10px/normal Monaco; ">----------------------------------------------------------------------</P><P style="margin-top: 0px; margin-right: 0px; margin-bottom: 0px; margin-left: 0px; font: normal normal normal 10px/normal Monaco; "><BR><BR class="khtml-block-placeholder"></P> </DIV><BR></BODY></HTML>