<html><head></head><body style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space; "><pre id="nonprop"><p align=""><font class="Apple-style-span" face="Helvetica" size="3"><span class="Apple-style-span" style="font-size: 12px; ">------------------------------------------------------------------------
Arabic-L: Thu 12 Nov 2009
Moderator: Dilworth Parkinson <<a href="mailto:dilworth_parkinson@byu.edu">dilworth_parkinson@byu.edu</a>>
[To post messages to the list, send them to <a href="mailto:arabic-l@byu.edu">arabic-l@byu.edu</a>]
[To unsubscribe, send message from same address you subscribed from to
<a href="mailto:listserv@byu.edu">listserv@byu.edu</a> with first line reading:
            unsubscribe arabic-l                                      ]

-------------------------Directory------------------------------------

1) Subject:Quranic Arabic Corpus-Version 0.1 Released

-------------------------Messages-----------------------------------
1)
Date: 12 Nov 2009
From:<span class="Apple-style-span" style="font-size: medium; white-space: normal; ">Kais Dukes <<a href="mailto:dukes.kais@googlemail.com">dukes.kais@googlemail.com</a>></span></span></font></p><p align=""><font class="Apple-style-span" face="Helvetica" size="3"><span class="Apple-style-span" style="font-size: 12px; "><span class="Apple-style-span" style="font-size: medium; white-space: normal; "><span class="Apple-style-span" style="font-size: 12px; white-space: pre; ">Subject:Quranic Arabic Corpus-Version 0.1 Released</span></span></span></font></p><p align=""><font class="Apple-style-span" face="Helvetica" size="3"><span class="Apple-style-span" style="font-size: 12px; ">
<span class="Apple-style-span" style="font-size: medium; white-space: normal; "><div style="margin-top: 0cm; margin-right: 0cm; margin-bottom: 0pt; margin-left: 0cm; "><span lang="EN-GB" style="font-size: 10pt; font-family: Arial, sans-serif; ">Hello All,</span></div><p class="MsoNormal" style="margin-top: 0cm; margin-right: 0cm; margin-bottom: 0pt; margin-left: 0cm; "><span lang="EN-GB" style="font-size: 10pt; font-family: Arial, sans-serif; "></span></p><p class="MsoNormal" style="margin-top: 0cm; margin-right: 0cm; margin-bottom: 0pt; margin-left: 0cm; "><span lang="EN-GB" style="font-size: 10pt; font-family: Arial, sans-serif; "></span> </p><div style="margin-top: 0cm; margin-right: 0cm; margin-bottom: 0pt; margin-left: 0cm; "><span lang="EN-GB" style="font-size: 10pt; font-family: Arial, sans-serif; ">For those interested in Arabic part-of-speech tagging and syntactic analysis, a new resource has now be made available as a free open source download:</span></div><p class="MsoNormal" style="margin-top: 0cm; margin-right: 0cm; margin-bottom: 0pt; margin-left: 0cm; "><span lang="EN-GB" style="font-size: 10pt; font-family: Arial, sans-serif; "></span> </p><div style="margin-top: 0cm; margin-right: 0cm; margin-bottom: 0pt; margin-left: 0cm; "><span lang="EN-GB" style="font-size: 10pt; font-family: Arial, sans-serif; "><a href="https://outlook.leeds.ac.uk/owa/redir.aspx?C=ffaadd7b35304061a27c86631c204a99&URL=http%3a%2f%2fquran.uk.net%2f" target="_blank"><font color="#800080"></font></a><a href="https://outlook.leeds.ac.uk/owa/redir.aspx?C=ffaadd7b35304061a27c86631c204a99&URL=http%3a%2f%2fquran.uk.net" target="_blank">http://quran.uk.net</a></span></div><p class="MsoNormal" style="margin-top: 0cm; margin-right: 0cm; margin-bottom: 0pt; margin-left: 0cm; "><span lang="EN-GB" style="font-size: 10pt; font-family: Arial, sans-serif; "></span> </p><div style="margin-top: 0cm; margin-right: 0cm; margin-bottom: 0pt; margin-left: 0cm; "><span lang="EN-GB" style="font-size: 10pt; font-family: Arial, sans-serif; ">You can now obtain version 0.1 of the data which includes:</span></div><p class="MsoNormal" style="margin-top: 0cm; margin-right: 0cm; margin-bottom: 0pt; margin-left: 0cm; "><span lang="EN-GB" style="font-size: 10pt; font-family: Arial, sans-serif; "> </span></p><div style="margin-top: 0cm; margin-right: 0cm; margin-bottom: 0pt; margin-left: 0cm; "><span lang="EN-GB" style="font-size: 10pt; font-family: Arial, sans-serif; ">(1) A plain text file showing each word in every verse of the Quran, together with its (contextual) part-of-speech tag.</span></div><div style="margin-top: 0cm; margin-right: 0cm; margin-bottom: 0pt; margin-left: 0cm; "><span lang="EN-GB" style="font-size: 10pt; font-family: Arial, sans-serif; ">(2) The same data in XML format encoded as UTF-8</span></div><div style="margin-top: 0cm; margin-right: 0cm; margin-bottom: 0pt; margin-left: 0cm; "><span lang="EN-GB" style="font-size: 10pt; font-family: Arial, sans-serif; ">(3) A more detailed XML file with full morphological (inflection+derivation) feature tags</span></div><p class="MsoNormal" style="margin-top: 0cm; margin-right: 0cm; margin-bottom: 0pt; margin-left: 0cm; "><span lang="EN-GB" style="font-size: 10pt; font-family: Arial, sans-serif; "></span> </p><div style="margin-top: 0cm; margin-right: 0cm; margin-bottom: 0pt; margin-left: 0cm; "><span lang="EN-GB" style="font-size: 10pt; font-family: Arial, sans-serif; ">We plan to produce incremental updates until we reach version 1.0 - cross-annotator verification for full morphology and syntax of the Quran using dependency grammar. The Quranic Arabic Corpus is an annotated linguistic resource consisting of 77,430 words of Quranic Arabic. The research project is led by Kais Dukes at the University of Leeds, and is part of the Arabic language computing research group within the School of Computing, supervised by Eric Atwell. </span><span lang="EN-GB" style="font-size: 10pt; font-family: Arial, sans-serif; ">The project aims to provide a richly annotated linguistic resource for researchers wanting to study the Arabic language of the Quran. The grammatical analysis helps readers further in uncovering the detailed intended meanings of each verse and sentence. Each word of the Quran is tagged with its part-of-speech as well as multiple morphological features. Unlike other annotated Arabic corpora, the grammar framework adopted by the Quranic Corpus is the traditional Arabic grammar of <i>i'rab</i>.</span></div><p class="MsoNormal" style="margin-top: 0cm; margin-right: 0cm; margin-bottom: 0pt; margin-left: 0cm; "><span lang="EN-GB" style="font-size: 10pt; font-family: Arial, sans-serif; "> </span></p><div style="margin-top: 0cm; margin-right: 0cm; margin-bottom: 0pt; margin-left: 0cm; "><span lang="EN-GB" style="font-size: 10pt; font-family: Arial, sans-serif; ">The research project includes:</span></div><p class="MsoNormal" style="margin-top: 0cm; margin-right: 0cm; margin-bottom: 0pt; margin-left: 0cm; "><span lang="EN-GB" style="font-size: 10pt; font-family: Arial, sans-serif; "> </span></p><div style="margin-top: 0cm; margin-right: 0cm; margin-bottom: 0pt; margin-left: 0cm; "><span lang="EN-GB" style="font-size: 10pt; font-family: Arial, sans-serif; ">- A manually verified part-of-speech tagged Quranic Arabic corpus.</span></div><div style="margin-top: 0cm; margin-right: 0cm; margin-bottom: 0pt; margin-left: 0cm; "><span lang="EN-GB" style="font-size: 10pt; font-family: Arial, sans-serif; ">- An annotated treebank of Quranic Arabic.</span></div><div style="margin-top: 0cm; margin-right: 0cm; margin-bottom: 0pt; margin-left: 0cm; "><span lang="EN-GB" style="font-size: 10pt; font-family: Arial, sans-serif; ">- A novel visualization of traditional Arabic grammar through dependency graphs.</span></div><div style="margin-top: 0cm; margin-right: 0cm; margin-bottom: 0pt; margin-left: 0cm; "><span lang="EN-GB" style="font-size: 10pt; font-family: Arial, sans-serif; ">- Morphological search for the Quran.</span></div><div style="margin-top: 0cm; margin-right: 0cm; margin-bottom: 0pt; margin-left: 0cm; "><span lang="EN-GB" style="font-size: 10pt; font-family: Arial, sans-serif; ">- A machine-readable morphological lexicon of Quranic words into English.</span></div><div style="margin-top: 0cm; margin-right: 0cm; margin-bottom: 0pt; margin-left: 0cm; "><span lang="EN-GB" style="font-size: 10pt; font-family: Arial, sans-serif; ">- A part-of-speech concordance for Quranic Arabic organized by lemma.</span></div><div style="margin-top: 0cm; margin-right: 0cm; margin-bottom: 0pt; margin-left: 0cm; "><span lang="EN-GB" style="font-size: 10pt; font-family: Arial, sans-serif; ">- An online message board for community volunteer annotation.</span></div><p class="MsoNormal" style="margin-top: 0cm; margin-right: 0cm; margin-bottom: 0pt; margin-left: 0cm; "><span lang="EN-GB" style="font-size: 10pt; font-family: Arial, sans-serif; "> </span></p><div style="margin-top: 0cm; margin-right: 0cm; margin-bottom: 0pt; margin-left: 0cm; "><span lang="EN-GB" style="font-size: 10pt; font-family: Arial, sans-serif; ">The annotation for each of the 77,430 words in the Quran has been reviewed in stages by two annotators, and improvements are still ongoing to further improve accuracy.</span></div><p class="MsoNormal" style="margin-top: 0cm; margin-right: 0cm; margin-bottom: 0pt; margin-left: 0cm; "><span lang="EN-GB" style="font-size: 10pt; font-family: Arial, sans-serif; "> </span></p><div style="margin-top: 0cm; margin-right: 0cm; margin-bottom: 0pt; margin-left: 0cm; "><span lang="EN-GB" style="font-size: 10pt; font-family: Arial, sans-serif; ">Any feedback on the project is most welcome.</span></div><p class="MsoNormal" style="margin-top: 0cm; margin-right: 0cm; margin-bottom: 0pt; margin-left: 0cm; "><span lang="EN-GB" style="font-size: 10pt; font-family: Arial, sans-serif; "> </span></p><div style="margin-top: 0cm; margin-right: 0cm; margin-bottom: 0pt; margin-left: 0cm; "><span lang="EN-GB" style="font-size: 10pt; font-family: Arial, sans-serif; ">Kind Regards,</span></div><p class="MsoNormal" style="margin-top: 0cm; margin-right: 0cm; margin-bottom: 0pt; margin-left: 0cm; "><span lang="EN-GB" style="font-size: 10pt; font-family: Arial, sans-serif; "> </span></p><div style="margin-top: 0cm; margin-right: 0cm; margin-bottom: 0pt; margin-left: 0cm; "><span lang="EN-GB" style="font-size: 10pt; font-family: Arial, sans-serif; ">-- Kais Dukes</span></div><div style="margin-top: 0cm; margin-right: 0cm; margin-bottom: 0pt; margin-left: 0cm; "><span lang="EN-GB" style="font-size: 10pt; font-family: Arial, sans-serif; ">School of Computing</span></div><div style="margin-top: 0cm; margin-right: 0cm; margin-bottom: 0pt; margin-left: 0cm; "><span lang="EN-GB" style="font-size: 10pt; font-family: Arial, sans-serif; ">University of Leeds</span></div><p class="MsoNormal" style="margin-top: 0cm; margin-right: 0cm; margin-bottom: 0pt; margin-left: 0cm; "><span lang="EN-GB" style="font-size: 10pt; font-family: Arial, sans-serif; "></span> </p><div style="margin-top: 0cm; margin-right: 0cm; margin-bottom: 0pt; margin-left: 0cm; "><span lang="EN-GB" style="font-size: 10pt; font-family: Arial, sans-serif; "><font face="arial">web: <a href="https://outlook.leeds.ac.uk/owa/redir.aspx?C=ffaadd7b35304061a27c86631c204a99&URL=http%3a%2f%2fquran.uk.net" target="_blank">http://quran.uk.net</a></font></span></div><div class="MsoNormal" style="margin-top: 0cm; margin-right: 0cm; margin-bottom: 0pt; margin-left: 0cm; "><span lang="EN-GB" style="font-size: 10pt; font-family: Arial, sans-serif; "><font face="arial">e-mail: <a href="mailto:sckd@leeds.ac.uk">sckd@leeds.ac.uk</a></font></span></div><div><font class="Apple-style-span" face="arial, sans-serif" size="3"><span class="Apple-style-span" style="font-size: 13px;"><br></span></font></div></span>
--------------------------------------------------------------------------
End of Arabic-L:  12 Nov 2009
</span></font></p><div><font class="Apple-style-span" face="Helvetica" size="3"><span class="Apple-style-span" style="font-size: 12px;"><br></span></font></div></pre></body></html>