<html><body style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space; "><pre id="nonprop"><p align=""><font class="Apple-style-span" face="Helvetica" size="3"><span class="Apple-style-span" style="font-size: 12px; ">------------------------------------------------------------------------
Arabic-L: Wed 21 Oct 2009
Moderator: Dilworth Parkinson <<a href="mailto:dilworth_parkinson@byu.edu">dilworth_parkinson@byu.edu</a>>
[To post messages to the list, send them to <a href="mailto:arabic-l@byu.edu">arabic-l@byu.edu</a>]
[To unsubscribe, send message from same address you subscribed from to
<a href="mailto:listserv@byu.edu">listserv@byu.edu</a> with first line reading:
            unsubscribe arabic-l                                      ]

-------------------------Directory------------------------------------

1) Subject:New Quran Arabic Treebank and Call for Volunteer Annotators

-------------------------Messages-----------------------------------
1)
Date: 21 Oct 2009
From:<a href="mailto:dukes.kais@googlemail.com">dukes.kais@googlemail.com</a>
Subject:New Quran Arabic Treebank and Call for Volunteer Annotators

<span class="Apple-style-span" style="font-size: medium; white-space: normal; "><div style="margin-top: 0cm; margin-right: 0cm; margin-bottom: 0pt; margin-left: 0cm; "><span lang="EN-GB" style="font-size: 10pt; ">Hello All,</span></div><p class="MsoNormal" style="margin-top: 0cm; margin-right: 0cm; margin-bottom: 0pt; margin-left: 0cm; "><span lang="EN-GB" style="font-size: 10pt; "> </span></p><div style="margin-top: 0cm; margin-right: 0cm; margin-bottom: 0pt; margin-left: 0cm; "><span lang="EN-GB" style="font-size: 10pt; ">A new version of the <b>Crescent Quran Corpus</b> is now freely available online at <a href="http://quran.uk.net/" target="_blank"><font color="#800080">http://quran.uk.net</font></a>. The corpus contains both morphological and syntactic annotation of the Quran in Arabic. Previous releases of the corpus focused on the morphology of Classical Arabic, but this new release now includes an in-progress syntactic treebank of the Quran. Some new features of this release of the corpus include:</span></div><p class="MsoNormal" style="margin-top: 0cm; margin-right: 0cm; margin-bottom: 0pt; margin-left: 0cm; "><span lang="EN-GB" style="font-size: 10pt; "> </span></p><div style="margin-top: 0cm; margin-right: 0cm; margin-bottom: 0pt; margin-left: 0cm; "><span lang="EN-GB" style="font-size: 10pt; ">(1) <b>Natural Language Generation </b>(NLG) has been applied to provide summaries in English of the morphology of each Arabic word of the Quran. For example:</span></div><p class="MsoNormal" style="margin-top: 0cm; margin-right: 0cm; margin-bottom: 0pt; margin-left: 0cm; "><span lang="EN-GB" style="font-size: 10pt; "> </span></p><div style="margin-top: 0cm; margin-right: 0cm; margin-bottom: 0pt; margin-left: 0cm; "><i><span lang="EN-GB" style="font-size: 10pt; ">The fourth word of verse (21:70) is divided into 4 morphological segments. A conjunction, verb, subject pronoun and object pronoun. The prefixed conjunction fa is usually translated as "then" or "so". The perfect verb (fi3il mad) is first person masculine plural. The verb's root is jim 3ayn lam (j 3 l). The attached object pronoun is third person masculine plural.</span></i></div><p class="MsoNormal" style="margin-top: 0cm; margin-right: 0cm; margin-bottom: 0pt; margin-left: 0cm; "><span lang="EN-GB" style="font-size: 10pt; "></span></p><div style="margin-top: 0cm; margin-right: 0cm; margin-bottom: 0pt; margin-left: 0cm; "><span lang="EN-GB" style="font-size: 10pt; ">See <a href="http://quran.uk.net/TokenDetail.aspx?location=(21:70:4)" target="_blank"><font color="#800080">http://quran.uk.net/TokenDetail.aspx?location=(21:70:4)</font></a></span></div><div style="margin-top: 0cm; margin-right: 0cm; margin-bottom: 0pt; margin-left: 0cm; "><i><span lang="EN-GB" style="font-size: 10pt; "> </span></i></div><div style="margin-top: 0cm; margin-right: 0cm; margin-bottom: 0pt; margin-left: 0cm; "><span lang="EN-GB" style="font-size: 10pt; ">(2) <strong>Syntactic Treebank</strong>. Syntactic annotation of the Quran has been expanded, using a hybrid dependency / constituency framework, following traditional Arabic grammar (i'3raab). Syntactic annotation is now available for chapters 67 to 114. See <a href="http://quran.uk.net/Treebank.aspx" target="_blank"><font color="#800080">http://quran.uk.net/Treebank.aspx</font></a>. Morphological annotation for all of the Quran with part-of-speech tagging has been reviewed and improved.</span></div><p class="MsoNormal" style="margin-top: 0cm; margin-right: 0cm; margin-bottom: 0pt; margin-left: 0cm; "><span lang="EN-GB" style="font-size: 10pt; "> </span></p><div style="margin-top: 0cm; margin-right: 0cm; margin-bottom: 0pt; margin-left: 0cm; "><span lang="EN-GB" style="font-size: 10pt; ">(3) <b>Quran Java API</b>. A Quran Java API for the text of the corpus has been integrated into the website, and is freely available for download.</span></div><p class="MsoNormal" style="margin-top: 0cm; margin-right: 0cm; margin-bottom: 0pt; margin-left: 0cm; "><span lang="EN-GB" style="font-size: 10pt; "> </span></p><div style="margin-top: 0cm; margin-right: 0cm; margin-bottom: 0pt; margin-left: 0cm; "><span lang="EN-GB" style="font-size: 10pt; ">(4) <b>Grammar Documentation and Annotation Guidelines</b>. The website now includes a comprehensive set of documentation on Arabic dependency grammar which also serves as set of guidelines for corpus annotators.</span></div><p class="MsoNormal" style="margin-top: 0cm; margin-right: 0cm; margin-bottom: 0pt; margin-left: 0cm; "><span lang="EN-GB" style="font-size: 10pt; "> </span></p><div style="margin-top: 0cm; margin-right: 0cm; margin-bottom: 0pt; margin-left: 0cm; "><span lang="EN-GB" style="font-size: 10pt; ">(5) <b>Audio Improvements</b>. A selection of 10 choices for audio, including an audio English translation of the text for each verse in the corpus.</span></div><p class="MsoNormal" style="margin-top: 0cm; margin-right: 0cm; margin-bottom: 0pt; margin-left: 0cm; "><span lang="EN-GB" style="font-size: 10pt; "> </span></p><div style="margin-top: 0cm; margin-right: 0cm; margin-bottom: 0pt; margin-left: 0cm; "><span lang="EN-GB" style="font-size: 10pt; ">(6) <strong>Arabic/English Lexicon of the Quran</strong>. Now includes root counts for each lexicon entry.</span></div><p class="MsoNormal" style="margin-top: 0cm; margin-right: 0cm; margin-bottom: 0pt; margin-left: 0cm; "><span lang="EN-GB" style="font-size: 10pt; "> </span></p><div style="margin-top: 0cm; margin-right: 0cm; margin-bottom: 0pt; margin-left: 0cm; "><span lang="EN-GB" style="font-size: 10pt; ">(7) <strong>Improved Visualization</strong>. The website provides improved visualization for 700 dependency graphs, with better website layout and navigation.</span></div><p class="MsoNormal" style="margin-top: 0cm; margin-right: 0cm; margin-bottom: 0pt; margin-left: 0cm; "><span lang="EN-GB" style="font-size: 10pt; "></span></p><div class="MsoNormal" style="margin-top: 0cm; margin-right: 0cm; margin-bottom: 0pt; margin-left: 0cm; "><span lang="EN-GB" style="font-size: 10pt; "></span> </div><div class="MsoNormal" style="margin-top: 0cm; margin-right: 0cm; margin-bottom: 0pt; margin-left: 0cm; "><span lang="EN-GB" style="font-size: 10pt; ">-----------------------------------<span lang="EN-GB" style="font-size: 10pt; ">-----------------------------------</span></span></div><p class="MsoNormal" style="margin-top: 0cm; margin-right: 0cm; margin-bottom: 0pt; margin-left: 0cm; "><span lang="EN-GB" style="font-size: 10pt; "> </span></p><div style="margin-top: 0cm; margin-right: 0cm; margin-bottom: 0pt; margin-left: 0cm; "><b><span lang="EN-GB" style="font-size: 10pt; ">Interested in becoming a volunteer annotator?</span></b></div><div class="MsoNormal" style="margin-top: 0cm; margin-right: 0cm; margin-bottom: 0pt; margin-left: 0cm; "><span lang="EN-GB" style="font-size: 10pt; "></span> </div><div class="MsoNormal" style="margin-top: 0cm; margin-right: 0cm; margin-bottom: 0pt; margin-left: 0cm; "><span lang="EN-GB" style="font-size: 10pt; ">We are currently looking for native Arabic speakers to assist in corpus annotation, and in particular syntactic annotation. The Crescent corpus is an open source community project with the aim of producing accurate multi-level annotation of the Quran in classical Arabic, including morphological and syntactic annotation. The framework adpoted for syntactic annotation is that of traditional Arabic dependency grammar (i'3raab).</span></div><p class="MsoNormal" style="margin-top: 0cm; margin-right: 0cm; margin-bottom: 0pt; margin-left: 0cm; "><span lang="EN-GB" style="font-size: 10pt; "></span></p><div class="MsoNormal" style="margin-top: 0cm; margin-right: 0cm; margin-bottom: 0pt; margin-left: 0cm; "><span lang="EN-GB" style="font-size: 10pt; "></span> </div><div class="MsoNormal" style="margin-top: 0cm; margin-right: 0cm; margin-bottom: 0pt; margin-left: 0cm; "><span lang="EN-GB" style="font-size: 10pt; ">For more information on the corpus please contact the main project researcher.</span></div><p class="MsoNormal" style="margin-top: 0cm; margin-right: 0cm; margin-bottom: 0pt; margin-left: 0cm; "><span lang="EN-GB" style="font-size: 10pt; "></span></p><div class="MsoNormal" style="margin-top: 0cm; margin-right: 0cm; margin-bottom: 0pt; margin-left: 0cm; "><span lang="EN-GB" style="font-size: 10pt; "></span> </div><div class="MsoNormal" style="margin-top: 0cm; margin-right: 0cm; margin-bottom: 0pt; margin-left: 0cm; "><span lang="EN-GB" style="font-size: 10pt; ">Kais Dukes,</span></div><div class="MsoNormal" style="margin-top: 0cm; margin-right: 0cm; margin-bottom: 0pt; margin-left: 0cm; "><span lang="EN-GB" style="font-size: 10pt; "></span> </div><div class="MsoNormal" style="margin-top: 0cm; margin-right: 0cm; margin-bottom: 0pt; margin-left: 0cm; "><span lang="EN-GB" style="font-size: 10pt; ">School of Computing</span></div><div style="margin-top: 0cm; margin-right: 0cm; margin-bottom: 0pt; margin-left: 0cm; "><span lang="EN-GB" style="font-size: 10pt; ">University of Leeds</span></div><div class="MsoNormal" style="margin-top: 0cm; margin-right: 0cm; margin-bottom: 0pt; margin-left: 0cm; "><span lang="EN-GB" style="font-size: 10pt; ">United Kingdom</span></div><div><font class="Apple-style-span" size="3"><span class="Apple-style-span" style="font-size: 13px;"><br></span></font></div></span>
--------------------------------------------------------------------------
End of Arabic-L:  21 Oct 2009
</span></font></p><div><font class="Apple-style-span" face="Helvetica" size="3"><span class="Apple-style-span" style="font-size: 12px;"><br></span></font></div></pre></body></html>