<html><head></head><body style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space; "><pre id="nonprop"><p align=""><font class="Apple-style-span" face="Helvetica" size="3"><span class="Apple-style-span" style="font-size: 12px; ">------------------------------------------------------------------------
Arabic-L: Fri 12 Jan 2010
Moderator: Dilworth Parkinson <<a href="mailto:dilworth_parkinson@byu.edu">dilworth_parkinson@byu.edu</a>>
[To post messages to the list, send them to <a href="mailto:arabic-l@byu.edu">arabic-l@byu.edu</a>]
[To unsubscribe, send message from same address you subscribed from to
<a href="mailto:listserv@byu.edu">listserv@byu.edu</a> with first line reading:
            unsubscribe arabic-l                                      ]

-------------------------Directory------------------------------------

1) Subject:Arabic demonstratives
2) Subject:Arabic demonstratives

-------------------------Messages-----------------------------------
1)
Date: 12 Jan 2010
From:<span class="Apple-style-span" style="font-size: medium; white-space: normal; ">Waheed Samy <<a href="mailto:wasamy@umich.edu">wasamy@umich.edu</a>></span>
Subject:Arabic demonstratives
<br></span></font></p><p align=""><font class="Apple-style-span" face="Helvetica" size="3"><span class="Apple-style-span" style="font-size: 12px; "><span class="Apple-style-span" style="font-size: medium; white-space: normal; ">Regarding the second question:<br><br>"does anyone have any thought on why Arabic, compared to English, uses more demonstratives in written texts? For example, in a corpus of 20,000 words of English there will be say 100 instances of demonstratives, while in a same-size corpus of Arabic, there will be 200 cases if not more. That can't be just due to the fact that Arabic has more lexical forms for the demonstratives, right?"<br><br>Concerning the written form of the language, Arabic and English pack syntactic categorical constituents very differently.  Whereas every English word is delineated by whitespace, Arabic packs more information within whitespace.  For example:<br>شاهدتُهم (I saw them) as a written unit bounded by whitespace consists of I + saw + them, which in English is three units.  <br>So for this example, what takes one 'word' in written Arabic requires three in English.<br><br>Perhaps you should factor this difference of information packing between English and Arabic.<br>Waheed Samy  <br></span>
--------------------------------------------------------------------------
2)
Date: 12 Jan 2010
From:<span class="Apple-style-span" style="font-size: medium; white-space: normal;">Dil Parkinson <<a href="mailto:dil@byu.edu">dil@byu.edu</a>></span>
Subject:Arabic demonstratives
<br></span></font></p><p align=""><font class="Apple-style-span" face="Helvetica" size="3"><span class="Apple-style-span" style="font-size: 12px;">There may be something to explain, but you probably have your data wrong, at least for American English.  I searched for this|that|these|those in the 400 million word corpus of American English, and got 1975 instances per 100,000 (which comes out to be about 400 per 20,000, not 100).  Admittedly, there is spoken English in this corpus, but it is overwhelmingly written.  I don't think you are going to be able to get it down to 100 per 20,000: perhaps you meant that more as a 'suppose or for example' than an actual claim).</span></font></p><div><span class="Apple-style-span" style="font-family: Helvetica; font-size: 12px; ">l looked at separate newspapers in arabiCorpus for hvA|hvh|vlk|tlk|hWlAC|LwlAC and found the following:</span></div><div><font class="Apple-style-span" face="Helvetica" size="3"><span class="Apple-style-span" style="font-size: 12px;"><br></span></font></div><div><font class="Apple-style-span" face="Helvetica" size="3"><span class="Apple-style-span" style="font-size: 12px;">Ahram (Egypt): 1240 per 100,000</span></font></div><div><font class="Apple-style-span" face="Helvetica" size="3"><span class="Apple-style-span" style="font-size: 12px;">Thawra (Syria): 1240 per 100,000</span></font></div><div><font class="Apple-style-span" face="Helvetica" size="3"><span class="Apple-style-span" style="font-size: 12px;">Tajdid (Morocco): 1600 per 100,000</span></font></div><div><font class="Apple-style-span" face="Helvetica" size="3"><span class="Apple-style-span" style="font-size: 12px;">Modern Literature: 1158 per 100,000</span></font></div><div><font class="Apple-style-span" face="Helvetica" size="3"><span class="Apple-style-span" style="font-size: 12px;">Pre-modern corpus: 2050 per 100,000</span></font></div><div><font class="Apple-style-span" face="Helvetica" size="3"><span class="Apple-style-span" style="font-size: 12px;"><br></span></font></div><div><font class="Apple-style-span" face="Helvetica" size="3"><span class="Apple-style-span" style="font-size: 12px;">Except for the pre-modern corpus (which is small and rather idiosyncratic, so I wouldn't trust those numbers that much), it is clear that Arabic writers use the common demonstratives a lot less than American English writers do.  Note the remarkable consistency in the Egypt/Syria percentages, while the Moroccan numbers are significantly higher.</span></font></div><div><font class="Apple-style-span" face="Helvetica" size="3"><span class="Apple-style-span" style="font-size: 12px;"><br></span></font></div><div><font class="Apple-style-span" face="Helvetica" size="3"><span class="Apple-style-span" style="font-size: 12px;">To repeat, there is something to explain, but it is not why Arabs use them more.</span></font></div><div><font class="Apple-style-span" face="Helvetica" size="3"><span class="Apple-style-span" style="font-size: 12px;"><br></span></font></div><div><font class="Apple-style-span" face="Helvetica" size="3"><span class="Apple-style-span" style="font-size: 12px;">dil</span></font></div><div><font class="Apple-style-span" face="Helvetica" size="3"><span class="Apple-style-span" style="font-size: 12px;"><br></span></font></div><div><span class="Apple-style-span" style="font-family: Helvetica; font-size: 12px; ">--------------------------------------------------------------------------</span></div><p align=""><font class="Apple-style-span" face="Helvetica" size="3"><span class="Apple-style-span" style="font-size: 12px; ">End of Arabic-L:  12 Jan 2010
</span></font></p><div><font class="Apple-style-span" face="Helvetica" size="3"><span class="Apple-style-span" style="font-size: 12px;"><br></span></font></div></pre></body></html>