<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN">
<HTML><HEAD>
<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=us-ascii">
<TITLE>Message</TITLE>

<STYLE type=text/css>BLOCKQUOTE {
        PADDING-BOTTOM: 0px; PADDING-TOP: 0px
}
DL {
        PADDING-BOTTOM: 0px; PADDING-TOP: 0px
}
UL {
        PADDING-BOTTOM: 0px; PADDING-TOP: 0px
}
OL {
        PADDING-BOTTOM: 0px; PADDING-TOP: 0px
}
LI {
        PADDING-BOTTOM: 0px; PADDING-TOP: 0px
}
</STYLE>

<META content="MSHTML 6.00.2800.1126" name=GENERATOR></HEAD>
<BODY>
<DIV>
<DIV><SPAN class=122554115-04022003><FONT face=Arial color=#0000ff size=2>while 
not claiming to be a "freak" I thought it might help you look 
at:</FONT></SPAN></DIV>
<DIV><SPAN class=122554115-04022003><SPAN class=747304315-04022003><FONT 
face=Arial color=#0000ff size=2>    </FONT></SPAN></SPAN><SPAN 
class=122554115-04022003><FONT color=#0000ff><A 
href="http://www.perldoc.com/perl5.8.0/lib/Unicode/Collate.html"><FONT 
face=Arial><FONT 
size=2>http://www.perldoc.com/perl5.8.0/lib/Unicode/Collate.html</FONT></FONT></A></FONT></SPAN></DIV>
<DIV><SPAN class=122554115-04022003><FONT face=Arial color=#0000ff size=2><SPAN 
class=747304315-04022003></SPAN></FONT></SPAN> </DIV></DIV>
<DIV></DIV>
<DIV class=OutlookMessageHeader lang=en-us dir=ltr align=left><FONT face=Tahoma 
size=2>-----Original Message-----<BR><B>From:</B> owner-corpora@lists.uib.no 
[mailto:owner-corpora@lists.uib.no] <B>On Behalf Of </B>Henning 
Reetz<BR><B>Sent:</B> Tuesday, February 04, 2003 9:57 AM<BR><B>To:</B> 
corpora@hd.uib.no<BR><B>Subject:</B> [Corpora-List] sorting OHG (non-ASCII) in 
PERL<BR><BR></FONT></DIV>
<DIV>Hi,</DIV>
<DIV><BR></DIV>
<DIV>stupid question but perhaps the freaks can help me:</DIV>
<DIV><BR></DIV>
<DIV>we're building a database of Old High German words. Obviously, there are 
some characters that are<B> not</B> in ASCII (diacritics like stress marks ' and 
carots ^) and chars that do not follow the 'normal' sorting order (like 'uu' for 
'w'). One possibility would be to recode these chars (e.g. get rid off the 
diacritics for sorting and put them back on in the output), but is there a more 
elegant and general way (e.g. in case one would like to have a long 'e' after 
the short 'e' etc.) so that one could use it for other scripts as well (UTF puts 
chars in an order that does not necessarily reflect the 'intuitiv' sequence in a 
language). - Is there a modul to tell PERL which sorting sequence one would like 
to use or do I have to program it myself?</DIV>
<DIV><BR></DIV>
<DIV>Thanx for any hints.</DIV>
<DIV><BR></DIV>
<DIV>Henning Reetz</DIV></BODY></HTML>