<html xmlns:v="urn:schemas-microsoft-com:vml" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:x="urn:schemas-microsoft-com:office:excel" xmlns:p="urn:schemas-microsoft-com:office:powerpoint" xmlns:a="urn:schemas-microsoft-com:office:access" xmlns:dt="uuid:C2F41010-65B3-11d1-A29F-00AA00C14882" xmlns:s="uuid:BDC6E3F0-6DA3-11d1-A2A3-00AA00C14882" xmlns:rs="urn:schemas-microsoft-com:rowset" xmlns:z="#RowsetSchema" xmlns:b="urn:schemas-microsoft-com:office:publisher" xmlns:ss="urn:schemas-microsoft-com:office:spreadsheet" xmlns:c="urn:schemas-microsoft-com:office:component:spreadsheet" xmlns:odc="urn:schemas-microsoft-com:office:odc" xmlns:oa="urn:schemas-microsoft-com:office:activation" xmlns:html="http://www.w3.org/TR/REC-html40" xmlns:q="http://schemas.xmlsoap.org/soap/envelope/" xmlns:D="DAV:" xmlns:x2="http://schemas.microsoft.com/office/excel/2003/xml" xmlns:ois="http://schemas.microsoft.com/sharepoint/soap/ois/" xmlns:dir="http://schemas.microsoft.com/sharepoint/soap/directory/" xmlns:ds="http://www.w3.org/2000/09/xmldsig#" xmlns:dsp="http://schemas.microsoft.com/sharepoint/dsp" xmlns:udc="http://schemas.microsoft.com/data/udc" xmlns:xsd="http://www.w3.org/2001/XMLSchema" xmlns:sub="http://schemas.microsoft.com/sharepoint/soap/2002/1/alerts/" xmlns:ec="http://www.w3.org/2001/04/xmlenc#" xmlns:sp="http://schemas.microsoft.com/sharepoint/" xmlns:sps="http://schemas.microsoft.com/sharepoint/soap/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:udcxf="http://schemas.microsoft.com/data/udc/xmlfile" xmlns:wf="http://schemas.microsoft.com/sharepoint/soap/workflow/" xmlns:mver="http://schemas.openxmlformats.org/markup-compatibility/2006" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns:mrels="http://schemas.openxmlformats.org/package/2006/relationships" xmlns:ex12t="http://schemas.microsoft.com/exchange/services/2006/types" xmlns:ex12m="http://schemas.microsoft.com/exchange/services/2006/messages" xmlns:Z="urn:schemas-microsoft-com:" xmlns:st="" xmlns="http://www.w3.org/TR/REC-html40">

<head>
<meta http-equiv=Content-Type content="text/html; charset=windows-1256">
<meta name=Generator content="Microsoft Word 12 (filtered medium)">
<style>
<!--
 /* Font Definitions */
 @font-face
        {font-family:"MS Mincho";
        panose-1:2 2 6 9 4 2 5 8 3 4;}
@font-face
        {font-family:"Cambria Math";
        panose-1:2 4 5 3 5 4 6 3 2 4;}
@font-face
        {font-family:Calibri;
        panose-1:2 15 5 2 2 2 4 3 2 4;}
@font-face
        {font-family:Tahoma;
        panose-1:2 11 6 4 3 5 4 4 2 4;}
@font-face
        {font-family:Consolas;
        panose-1:2 11 6 9 2 2 4 3 2 4;}
@font-face
        {font-family:"\@MS Mincho";
        panose-1:2 2 6 9 4 2 5 8 3 4;}
 /* Style Definitions */
 p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0in;
        margin-bottom:.0001pt;
        font-size:12.0pt;
        font-family:"Times New Roman","serif";}
a:link, span.MsoHyperlink
        {mso-style-priority:99;
        color:blue;
        text-decoration:underline;}
a:visited, span.MsoHyperlinkFollowed
        {mso-style-priority:99;
        color:purple;
        text-decoration:underline;}
pre
        {mso-style-priority:99;
        mso-style-link:"HTML Preformatted Char";
        margin:0in;
        margin-bottom:.0001pt;
        font-size:10.0pt;
        font-family:"Courier New";}
span.HTMLPreformattedChar
        {mso-style-name:"HTML Preformatted Char";
        mso-style-priority:99;
        mso-style-link:"HTML Preformatted";
        font-family:Consolas;}
span.EmailStyle19
        {mso-style-type:personal-reply;
        font-family:"Calibri","sans-serif";
        color:#1F497D;}
.MsoChpDefault
        {mso-style-type:export-only;}
@page Section1
        {size:8.5in 11.0in;
        margin:1.0in 1.0in 1.0in 1.0in;}
div.Section1
        {page:Section1;}
-->
</style>
<!--[if gte mso 9]><xml>
 <o:shapedefaults v:ext="edit" spidmax="1026" />
</xml><![endif]--><!--[if gte mso 9]><xml>
 <o:shapelayout v:ext="edit">
  <o:idmap v:ext="edit" data="1" />
 </o:shapelayout></xml><![endif]-->
</head>

<body lang=EN-US link=blue vlink=purple>

<div class=Section1>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Dear Fatima,<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'><o:p> </o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>You might want to experiment with the Transliteration Utility
that is available here: <a
href="http://www.microsoft.com/globaldev/tools/translit.mspx">http://www.microsoft.com/globaldev/tools/translit.mspx</a>
<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'><o:p> </o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>It allows you to convert one natural language script to another
(like Serbian Latin to Serbian Cyrillic or Latin characters to Inuktitut). The
tool uses a simple but powerful rule language to create, edit, debug, and test
your own natural language transliteration modules to convert one script to
another. The nine modules it includes do not cover Pashto, but there is
built-in documentation which explains how to create additional modules. See
also this post for some more details:<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'><o:p> </o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'><a
href="http://blogs.msdn.com/correcteurorthographiqueoffice/archive/2006/02/07/transliteration-utility-freely-downloadable.aspx">http://blogs.msdn.com/correcteurorthographiqueoffice/archive/2006/02/07/transliteration-utility-freely-downloadable.aspx</a>
<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'><o:p> </o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>I hope it helps,<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'><o:p> </o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Best wishes,<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'><o:p> </o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Thierry<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'><o:p> </o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Thierry Fontenelle<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Microsoft Natural Language Group<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'><a href="mailto:thierryf@microsoft.com">thierryf@microsoft.com</a>
<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'><o:p> </o:p></span></p>

<div style='border:none;border-top:solid #B5C4DF 1.0pt;padding:3.0pt 0in 0in 0in'>

<p class=MsoNormal><b><span style='font-size:10.0pt;font-family:"Tahoma","sans-serif"'>From:</span></b><span
style='font-size:10.0pt;font-family:"Tahoma","sans-serif"'> corpora-bounces@uib.no
[mailto:corpora-bounces@uib.no] <b>On Behalf Of </b>fatima zuhra<br>
<b>Sent:</b> Thursday, September 18, 2008 9:53 PM<br>
<b>To:</b> wheston@sas.upenn.edu<br>
<b>Cc:</b> Corpora@uib.no; sir abid<br>
<b>Subject:</b> Re: [Corpora-List] Fwd: Fw: Pashto Transliteration Scheme<o:p></o:p></span></p>

</div>

<p class=MsoNormal><o:p> </o:p></p>

<table class=MsoNormalTable border=0 cellspacing=0 cellpadding=0>
 <tr>
  <td valign=top style='padding:0in 0in 0in 0in'>
  <div>
  <p class=MsoNormal>Dear Wilma,<o:p></o:p></p>
  </div>
  <div>
  <p class=MsoNormal> <o:p></o:p></p>
  </div>
  <div>
  <p class=MsoNormal>Thanks for your helpful e-mail. I am actually looking for
  a transliteration scheme for Pashto, not a phonetic transcription scheme. It
  is because written Pashto does not include symbols for short vowels. I have
  been working on the development of an alphabet transducer (computer program)
  for Pashto that can map from romanized Pashto to Arabic-scripted Pashto and
  vice versa. I want to use a standard transliteration scheme in
  this programming. One of the corpora-list members has sent me a
  transliterations scheme for Pashto, which is available on the following
  URL:<o:p></o:p></p>
  </div>
  <div>
  <p class=MsoNormal> <o:p></o:p></p>
  </div>
  <div>
  <p class=MsoNormal><a href="http://www.loc.gov/catdir/cpso/roman.html">http://www.loc.gov/catdir/cpso/roman.html</a><o:p></o:p></p>
  </div>
  <div>
  <p class=MsoNormal> <o:p></o:p></p>
  </div>
  <div>
  <p class=MsoNormal>Using this scheme, I may have the following problem:<o:p></o:p></p>
  </div>
  <div>
  <p class=MsoNormal> <o:p></o:p></p>
  </div>
  <div>
  <p class=MsoNormal>This scheme uses 'k' for the Pashto symbol '<span
  lang=AR-SA dir=RTL>˜</span><span dir=LTR></span><span dir=LTR></span>' ,
  'h' for '<span lang=AR-SA dir=RTL>å</span><span dir=LTR></span><span dir=LTR></span>' and
  'kh' for '<span lang=AR-SA dir=RTL>Î</span><span dir=LTR></span><span
  dir=LTR></span>'. Now, if my alphabet transducer encounters a 'kh' in input,
  it will be confused either to map it to '<span lang=AR-SA dir=RTL>Î</span><span
  dir=LTR></span><span dir=LTR></span>' or to '<span lang=AR-SA dir=RTL>˜å</span><span
  dir=LTR></span><span dir=LTR></span>'?<o:p></o:p></p>
  </div>
  <div>
  <p class=MsoNormal> <o:p></o:p></p>
  </div>
  <div>
  <p class=MsoNormal>For such a situation, I have raised the question that
  whether I can make the changes of my choice in an already existing transliteration
  scheme? <o:p></o:p></p>
  </div>
  <div>
  <p class=MsoNormal> <o:p></o:p></p>
  </div>
  <div>
  <p class=MsoNormal>I'll be very thankful for any kind suggestions in this
  regard.<o:p></o:p></p>
  </div>
  <div>
  <p class=MsoNormal> <o:p></o:p></p>
  </div>
  <div>
  <p class=MsoNormal>Thanks.<o:p></o:p></p>
  </div>
  <div>
  <p class=MsoNormal> <o:p></o:p></p>
  </div>
  <div>
  <p class=MsoNormal>Fatima Zuhra<o:p></o:p></p>
  </div>
  <div>
  <p class=MsoNormal> <o:p></o:p></p>
  </div>
  <div>
  <p class=MsoNormal>University of Peshawar, Pakistan<br>
  <br>
  --- On <b>Tue, 9/16/08, wheston@sas.upenn.edu <i><wheston@sas.upenn.edu></i></b>
  wrote:<o:p></o:p></p>
  </div>
  <blockquote style='border:none;border-left:solid #1010FF 1.5pt;padding:0in 0in 0in 4.0pt;
  margin-left:3.75pt;margin-top:5.0pt;margin-bottom:5.0pt'>
  <p class=MsoNormal style='margin-bottom:12.0pt'>From: wheston@sas.upenn.edu
  <wheston@sas.upenn.edu><br>
  Subject: Fwd: Fw: [Corpora-List] Pashto Transliteration Scheme<br>
  To: fateeshah@yahoo.com<br>
  Cc: ebashir@yahoo.com<br>
  Date: Tuesday, September 16, 2008, 6:42 AM<o:p></o:p></p>
  <pre>This is in response to an email forwarded to me by Dr. Elena Bashir.<o:p></o:p></pre><pre><o:p> </o:p></pre><pre>--- On Sat, 9/13/08, fatima zuhra <fateeshah@yahoo.com> wrote:<o:p></o:p></pre><pre><o:p> </o:p></pre><pre>> From: fatima zuhra <fateeshah@yahoo.com><o:p></o:p></pre><pre>> Subject: [Corpora-List] Pashto Transliteration Scheme<o:p></o:p></pre><pre>> To: Corpora@uib.no<o:p></o:p></pre><pre>> Date: Saturday, September 13, 2008, 12:57 AM<o:p></o:p></pre><pre>> Dear group members,<o:p></o:p></pre><pre>><o:p> </o:p></pre><pre>> I am a Pashto language researcher in the field of Natural<o:p></o:p></pre><pre>> Language Processing. I want to know some standard<o:p></o:p></pre><pre>> transliteration scheme for Pashto. In my research, I am<o:p></o:p></pre><pre>> currently using a transliteration scheme that is similar to<o:p></o:p></pre><pre>> that of Herbert Penzl (1955).<o:p></o:p></pre><pre><o:p> </o:p></pre><pre>Are you looking for a transliteration scheme (one roman letter for each written<o:p></o:p></pre><pre>Pashto letter) or a transcription scheme (phonetic representations which<o:p></o:p></pre><pre>include short vowels)?  Penzl (1955) gives transcriptions, not<o:p></o:p></pre><pre>transliterations.<o:p></o:p></pre><pre><o:p> </o:p></pre><pre>>  By similar I mean to say that<o:p></o:p></pre><pre>> I have done some changes in that scheme in order to easily<o:p></o:p></pre><pre>> input data using keyboard. I'll be thankful if someone<o:p></o:p></pre><pre>> kindly answer my these questions:<o:p></o:p></pre><pre>><o:p> </o:p></pre><pre>> Q.1 Is there some standard transliteration scheme available<o:p></o:p></pre><pre>> for Pashto that is used in computer applications for Pashto?<o:p></o:p></pre><pre><o:p> </o:p></pre><pre>I don’t think so.  For typing convenience, some scholars of Indo-Iranian use<o:p></o:p></pre><pre>capital letters for both retroflexion and long vowels.  When Penzl was writing<o:p></o:p></pre><pre>in 1955, no one was doing computer work with languages; even in the 1970s (when<o:p></o:p></pre><pre>I did my dissertation using computerized texts for 4 Iranian languages), the<o:p></o:p></pre><pre>use<o:p></o:p></pre><pre>of alphabetic inputs was generally restricted to lower case ASCII. There are<o:p></o:p></pre><pre>many options now available when computerizing language materials.<o:p></o:p></pre><pre><o:p> </o:p></pre><pre>> Q.2 If there are some symbols in a transliteration scheme,<o:p></o:p></pre><pre>> which are hard to input using a keyboard, then can I make<o:p></o:p></pre><pre>> changes in such a scheme (to make it easy for my<o:p></o:p></pre><pre>> application)?<o:p></o:p></pre><pre><o:p> </o:p></pre><pre>I think that it’s a matter of your convenience, so long as you explain what<o:p></o:p></pre><pre>you’ve done.  If your choices are very unconventional, it places a burden on<o:p></o:p></pre><pre>readers of your work.  You might want to explore the Doulos Unicode fonts<o:p></o:p></pre><pre>(available on the SIL website) for phonetic transcriptions; they include a dot<o:p></o:p></pre><pre>beneath retroflex consonants (e.g., 1E6D for retroflex _t_) and the digraphs<o:p></o:p></pre><pre>_tz_ and _ts_ (Unicode 01F3 and 02a6, respectively).<o:p></o:p></pre><pre><o:p> </o:p></pre><pre>Wilma Heston<o:p></o:p></pre><pre><o:p> </o:p></pre><pre><o:p> </o:p></pre></blockquote>
  </td>
 </tr>
</table>

<p class=MsoNormal><span style='font-size:10.0pt;font-family:"Calibri","sans-serif"'><o:p> </o:p></span></p>

</div>

</body>

</html>