<html><head></head><body style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space; "><div>Thank you for your replays, however, I think it is better to shed a light to my question:</div><div>I formally define complex morphology as the role of clitics in a language, for example see this(1):</div><div>"<span style="font-family: Times; ">Similarly, the following list, excerpted from Hakkani-Tu ̈ r et al. (2002), shows a few
of the words producible in Turkish from the root </span><span style="font-family: Times; font-style: italic; ">uyu-, </span><span style="font-family: Times; ">’sleep’:</span></div><div><span class="Apple-style-span" style="font-family: Times; ">uyuyorum ‘I am sleeping’</span></div><div><span class="Apple-style-span" style="font-family: Times; ">uyuduk ‘we slept’</span></div><div><span class="Apple-style-span" style="font-family: Times; ">uyuman ‘your sleeping’</span></div><div><span style="font-family: Times; ">uyutmak ‘to cause someone to sleep’"</span><span class="Apple-style-span" style="font-family: Times; font-style: italic; "> </span><span class="Apple-style-span" style="font-family: Times; font-size: 13px; font-style: italic; ">  </span></div><div><br></div><div>As you can see, clitics in Turkish play more syntactic and semantic roles than English. So in such language we found more inflectional surface form from a word. This properties arise many different problem in different NLP tasks such as POS tagging, SMT, IR, and etc. Maybe the most dominant problem is you need more data (text) in learning stage for any statistical approaches for these tasks.</div><div><br></div><div>Another plus point that should be taken in consideration is that, I want to know can we group different language to some types by features like what I mentioned, so that morphology analysis of them is similar to each other? </div><div>Although, the complexity of a language and where language put this complexity is very interesting, I think it needs another post to disgust.  </div><div><br></div><div>Regards,<br>Majid Laali,<br>Natural Language and text Processing Laboratory(<a href="http://ece.ut.ac.ir/NLP">http://ece.ut.ac.ir/NLP</a>),<br>School of Electrical and Computer Engineering,<br>College of Engineering, University of Tehran, Tehran, Iran<br><a href="mailto:m.laali@ut.ac.ir">m.laali@ut.ac.ir</a></div><div><br></div><div>(1) example is from "Speech and Language Processing An introduction to natural language processing, computational linguistics, and speech recognition" book</div><br><div><div>On Dec 12, 2011, at 3:36 PM, Graham White wrote:</div><br class="Apple-interchange-newline"><blockquote type="cite"><div>I suspect a lot of it is simply random drift: languages have to put their complexity somewhere, but there is a lot of choice as to where they put it. French, for example, has lost the noun inflections which<br>Latin has, but it's acquired a complex system of clitics, which<br>Latin doesn't have. And even English, though it's not as morphologically complex as its predecessors, has a very complex<br>tense and aspect system (which non-native speakers seem to find<br>very hard to acquire). People tend to notice morphological complexity<br>because it's fairly visible, but there are many other ways of being<br>complex which aren't so obvious at first sight.<br><br>Graham<br><br>On 12/12/11 11:27, Grzegorz Chrupała wrote:<br><blockquote type="cite">Dear Majid,<br></blockquote><blockquote type="cite"><br></blockquote><blockquote type="cite">On Mon, Dec 12, 2011 at 13:52, Majid Laali<<a href="mailto:mjlaali@gmail.com">mjlaali@gmail.com</a>>  wrote:<br></blockquote><blockquote type="cite"><blockquote type="cite">Dear Corpora List,<br></blockquote></blockquote><blockquote type="cite"><blockquote type="cite"><br></blockquote></blockquote><blockquote type="cite"><blockquote type="cite">I am working on developing an stemmer/lemmatization system for Persian.<br></blockquote></blockquote><blockquote type="cite"><blockquote type="cite">However, I am curious to know why some languages like Persian, Turkish,<br></blockquote></blockquote><blockquote type="cite"><blockquote type="cite">Chinese have complex morphology system, meanwhile other languages like<br></blockquote></blockquote><blockquote type="cite"><blockquote type="cite">English have much more simpler morphology system.<br></blockquote></blockquote><blockquote type="cite"><br></blockquote><blockquote type="cite">Actually Chinese has virtually no morphology. Persian morphology is<br></blockquote><blockquote type="cite">also relatively simple compared to many other languages (e.g. Slavic).<br></blockquote><blockquote type="cite"><br></blockquote><blockquote type="cite"><blockquote type="cite">In other hand, is there<br></blockquote></blockquote><blockquote type="cite"><blockquote type="cite">any criteria caused such difference like their historical change, their<br></blockquote></blockquote><blockquote type="cite"><blockquote type="cite">lexicon properties, or their type (Indo-European, or more specific type like<br></blockquote></blockquote><blockquote type="cite"><blockquote type="cite">Romance)?<br></blockquote></blockquote><blockquote type="cite"><blockquote type="cite"><br></blockquote></blockquote><blockquote type="cite"><br></blockquote><blockquote type="cite">There is usually a trade-off between complexity in the morphology and<br></blockquote><blockquote type="cite">complexity in the syntax. Regarding historical origins, one factor<br></blockquote><blockquote type="cite">causing a simplification of morphology seems to be creolization. But<br></blockquote><blockquote type="cite">of course it is only one of many factors.<br></blockquote><blockquote type="cite"><br></blockquote><blockquote type="cite">Best,<br></blockquote><blockquote type="cite">--<br></blockquote><blockquote type="cite">Grzegorz<br></blockquote><blockquote type="cite"><br></blockquote><blockquote type="cite">_______________________________________________<br></blockquote><blockquote type="cite">UNSUBSCRIBE from this page: <a href="http://mailman.uib.no/options/corpora">http://mailman.uib.no/options/corpora</a><br></blockquote><blockquote type="cite">Corpora mailing list<br></blockquote><blockquote type="cite"><a href="mailto:Corpora@uib.no">Corpora@uib.no</a><br></blockquote><blockquote type="cite"><a href="http://mailman.uib.no/listinfo/corpora">http://mailman.uib.no/listinfo/corpora</a><br></blockquote><br>_______________________________________________<br>UNSUBSCRIBE from this page: <a href="http://mailman.uib.no/options/corpora">http://mailman.uib.no/options/corpora</a><br>Corpora mailing list<br><a href="mailto:Corpora@uib.no">Corpora@uib.no</a><br><a href="http://mailman.uib.no/listinfo/corpora">http://mailman.uib.no/listinfo/corpora</a><br></div></blockquote></div><br><div apple-content-edited="true"><br><br><br>
</div>
<br></body></html>