<div dir="ltr">Hello Stephen,<br>I got interested in this structure a while back, but got busy with other work.<br>After reading your email, I decided to try and discover whether this structure occurs in more formal discourse, and I searched a small portion of the Arabic Gigaword corpus using a simple, and naive, script that still needs a lot of improvement.<br>
<br>I have found three examples in the portion I examined. The script is attached. It is based on the idea that the structure occurs when we use kAn followed by PREP+NOUN.<br><br><div class="gmail_quote">On Thu, Dec 1, 2011 at 3:57 PM, Hewitt, Stephen <span dir="ltr"><<a href="mailto:s.hewitt@unesco.org">s.hewitt@unesco.org</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex;">









<div link="blue" vlink="purple" lang="RU">

<div>

<p style="text-align:justify;text-justify:inter-ideograph"><b><font face="Gentium" size="3"><span style="font-size:12.0pt;font-weight:normal" lang="EN-GB">Dear
all,<u></u><u></u></span></font></b></p>

<p style="text-align:justify;text-justify:inter-ideograph"><b><font face="Gentium" size="3"><span style="font-size:12.0pt;font-weight:normal" lang="EN-GB">I
am looking for a searchable corpus of spontaneous oral MSA (Modern Standard
Arabic).<u></u><u></u></span></font></b></p>

<p style="text-align:justify;text-justify:inter-ideograph"><b><font face="Gentium" size="3"><span style="font-size:12.0pt;font-weight:normal" lang="EN-GB">I
am particularly interested in instances of what I call “faulty accusatives”,
cf:<u></u><u></u></span></font></b></p>

<p style="text-align:justify;text-justify:inter-ideograph"><b><i><font face="Gentium" size="3"><span style="font-size:12.0pt;font-weight:normal;font-style:italic" lang="EN-GB">wāħid: ’an yakūn ladēk hadaf</span></font></i></b><i><font size="3"><span style="font-size:12.0pt;font-style:italic" lang="EN-GB">an</span></font></i><font size="3"><span style="font-size:12.0pt;font-weight:normal" lang="EN-GB"> “One: that
you should have an objective” </span></font><font size="3"><span style="font-size:12.0pt;font-weight:normal" lang="ES">–</span></font><font size="3"><span style="font-size:12.0pt;font-weight:normal" lang="EN-GB"> Muħammad
Ħasanain Haikal, <i><span style="font-style:italic">Ma‘a Haikal (With
Haikal)</span></i>, Al-Jazeera, 2008.03.20.<u></u><u></u></span></font></p>

<p style="text-align:justify;text-justify:inter-ideograph"><b><font face="Gentium" size="3"><span style="font-size:12.0pt;font-weight:normal" lang="EN-GB">In
other words, examples of erroneous use (according to Arabic grammatical
tradition) of the accusative indefinite </span></font></b><i><font size="3"><span style="font-size:12.0pt;font-style:italic" lang="EN-GB">–an</span></font></i><font size="3"><span style="font-size:12.0pt;font-weight:normal" lang="EN-GB">, usually
instead of nominative indefinite </span></font><i><font size="3"><span style="font-size:12.0pt;font-style:italic" lang="EN-GB">–un</span></font></i><font size="3"><span style="font-size:12.0pt;font-weight:normal" lang="EN-GB"> (most
often elided).<u></u><u></u></span></font></p>

<p style="text-align:justify;text-justify:inter-ideograph"><b><font face="Gentium" size="3"><span style="font-size:12.0pt;font-weight:normal" lang="EN-GB">What
can be observed in spontaneous production of MSA appears to correspond very
closely to what is known as “syntactic direct object [initial consonant] mutation”
in Welsh, which in fact covers rather more than just indefinite direct objects.
Quite a lot has been written on Welsh syntactic mutation in recent years, with
various explanations for the observable instances, not all of which are covered
by traditional grammars.<u></u><u></u></span></font></b></p>

<p style="text-align:justify;text-justify:inter-ideograph"><b><font face="Gentium" size="3"><span style="font-size:12.0pt;font-weight:normal" lang="EN-GB">However,
as far as I know, nothing has been written on such “faulty accusatives” in
spontaneous MSA; the assumption appears to be that since there are technically
no native speakers, there can be no reliable linguistic analysis of such
“slips” – they are just random mistakes, not worth analysing.<u></u><u></u></span></font></b></p>

<p style="text-align:justify;text-justify:inter-ideograph"><b><font face="Gentium" size="3"><span style="font-size:12.0pt;font-weight:normal" lang="EN-GB">I
am not convinced that that is the case; I believe that some users of MSA
achieve near-native fluency, and hence develop their own internal grammar,
which may not coincide on all points with the formal traditional grammar of <i><span style="font-style:italic">fuṣḥà</span></i>. Such error patterns thus
become significant, revealing something about the speaker’s internal grammar.<u></u><u></u></span></font></b></p>

<p style="text-align:justify;text-justify:inter-ideograph"><b><font face="Gentium" size="3"><span style="font-size:12.0pt;background:yellow;font-weight:normal" lang="EN-GB">Can anyone help me to find a reliable and searchable corpus
of spontaneous oral MSA Arabic (either in Arabic script or in transcription) which
has not been edited for such “mistakes”.</span></font></b><font size="3"><span style="font-size:12.0pt;font-weight:normal" lang="EN-GB"> Al-Jazeera post
transcripts of some of their live talk shows in which numerous non-MSA items (<i><span style="font-style:italic">šū, mā fīš, dil-wa’ti</span></i>,
etc.) are faithfully reproduced, but I am not certain that <i><span style="font-style:italic">wāħid: ’an yakūn ladēk hadaf</span></i></span></font><i><font size="3"><span style="font-size:12.0pt;font-style:italic" lang="EN-GB">an</span></font></i><font size="3"><span style="font-size:12.0pt;font-weight:normal" lang="EN-GB"> would not
be edited to a more “correct” <i><span style="font-style:italic">wāħid:
’an yakūn ladēk hadaf</span></i>.<u></u><u></u></span></font></p>

<p style="text-align:justify;text-justify:inter-ideograph"><b><font face="Gentium" size="3"><span style="font-size:12.0pt;font-weight:normal" lang="EN-GB">Many
thanks,<u></u><u></u></span></font></b></p>

<p style="text-align:justify;text-justify:inter-ideograph"><b><font face="Gentium" size="3"><span style="font-size:12.0pt;font-weight:normal" lang="EN-GB">Steve
Hewitt<u></u><u></u></span></font></b></p>

<p style="text-align:justify;text-justify:inter-ideograph"><b><font face="Gentium" size="3"><span style="font-size:12.0pt;font-weight:normal" lang="EN-GB"><a href="mailto:s.hewitt@unesco.org" target="_blank"><i><span style="font-style:italic">s.hewitt@unesco.org</span></i></a>
<u></u><u></u></span></font></b></p>

<p class="MsoNormal"><font face="Cambria" size="2" color="blue"><span style="font-size:11.0pt;font-family:Cambria;color:blue" lang="EN-GB"><u></u> <u></u></span></font></p>

</div>

<font face="monospace"><br>
<br>
<br>
Getting to Zero : Zero New HIV Infections. Zero Discrimination and Zero AIDS Related Deaths<br>
<br>
Objectif zéro : Zéro nouvelle infection à VIH. Zéro discrimination. Zéro décès lié au SIDA<br>
<br>
WORLD AIDS DAY 2011<br>
<a href="http://www.unesco.org/aids" target="_blank">http://www.unesco.org/aids</a></font></div>


<br>_______________________________________________<br>
UNSUBSCRIBE from this page: <a href="http://mailman.uib.no/options/corpora" target="_blank">http://mailman.uib.no/options/corpora</a><br>
Corpora mailing list<br>
<a href="mailto:Corpora@uib.no">Corpora@uib.no</a><br>
<a href="http://mailman.uib.no/listinfo/corpora" target="_blank">http://mailman.uib.no/listinfo/corpora</a><br>
<br></blockquote></div><br><br clear="all"><br>-- <br><div dir="ltr"><font size="1"><span style="color:rgb(255, 0, 0);background-color:rgb(255, 204, 51);font-family:comic sans ms,sans-serif">Emad Soliman Ali Mohamed </span><br style="color:rgb(255, 0, 0);background-color:rgb(255, 204, 51);font-family:comic sans ms,sans-serif">
<span style="color:rgb(255, 0, 0);background-color:rgb(255, 204, 51);font-family:comic sans ms,sans-serif">aka Emad Nawfal </span><span style="color:rgb(255, 0, 0);font-family:'comic sans ms', sans-serif">(<b>عماد نوفل</b>)</span><br style="color:rgb(255, 0, 0);background-color:rgb(255, 204, 51);font-family:comic sans ms,sans-serif">
<span style="color:rgb(255, 0, 0);background-color:rgb(255, 204, 51);font-family:comic sans ms,sans-serif">PhD in Linguistics, Computational Linguistics Track,</span></font><div><font size="1"><span style="color:rgb(255, 0, 0);background-color:rgb(255, 204, 51);font-family:comic sans ms,sans-serif">Department of Linguistics,</span><br style="color:rgb(255, 0, 0);background-color:rgb(255, 204, 51);font-family:comic sans ms,sans-serif">
<span style="color:rgb(255, 0, 0);background-color:rgb(255, 204, 51);font-family:comic sans ms,sans-serif">Indiana University, Bloomington</span><br style="color:rgb(255, 0, 0);background-color:rgb(255, 204, 51);font-family:comic sans ms,sans-serif">
<span style="color:rgb(255, 0, 0);background-color:rgb(255, 204, 51);font-family:comic sans ms,sans-serif"><a href="http://jones.ling.indiana.edu/%7Eemadnawfal" target="_blank">http://jones.ling.indiana.edu/~emadnawfal</a></span></font></div>
</div><br>
</div>