Dear Lisa,<br>a few months ago, I extracted a list of Arabic plurals, but never had the time to clean it. It has over 7000 nouns and their plurals. The list is available here:<br><br><a href="http://jones.ling.indiana.edu/~emadnawfal/arabicPlural.txt">http://jones.ling.indiana.edu/~emadnawfal/arabicPlural.txt</a><br>
<br>Hope you find it useful.<br><br><div class="gmail_quote">On Thu, Nov 19, 2009 at 6:00 AM,  <span dir="ltr"><<a href="mailto:corpora-request@uib.no">corpora-request@uib.no</a>></span> wrote:<br><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
Today's Topics:<br>
<br>
   1. Re:  Proposal for initiating a global non continentalArabic<br>
      Language Academy (Amal AlSaif)<br>
   2.  Job: PostDoc Researcher, University of Joensuu,  Finland<br>
      (Tuomo Kakkonen)<br>
   3.  Arabic Broken Plural Dictionary (Lisa Hesterberg)<br>
   4.  Call for participation: Methodological Advances in<br>
      corpus-based Translation Studies (Ghent, 8-9 January 2010)<br>
      (Gert De Sutter)<br>
   5. Re:  Word lists for Wordsmith Tools (zanca)<br>
   6.  2nd Call for Chapter - Ontology Learning and     Knowledge<br>
      Discovery Using the Web (wilson@csse)<br>
<br>
<br>
----------------------------------------------------------------------<br>
<br>
Message: 1<br>
Date: Wed, 18 Nov 2009 03:56:29 -0800 (PST)<br>
From: Amal AlSaif <<a href="mailto:amalalsaif@yahoo.co.uk">amalalsaif@yahoo.co.uk</a>><br>
Subject: Re: [Corpora-List] Proposal for initiating a global non<br>
        continentalArabic Language Academy<br>
To: Hamed Al-Suhli <<a href="mailto:hamed@e3rab.com">hamed@e3rab.com</a>><br>
Cc: "<a href="mailto:corpora@uib.no">corpora@uib.no</a>" <<a href="mailto:corpora@uib.no">corpora@uib.no</a>><br>
<br>
Dear Hamed,<br>
 <br>
I've just seen the brilliant suggestions.<br>
I will be pleased to be a member of a special Arabic corpora group<br>
My project is about the automatic discourse annotation for Arabic. We will produce soon the Leeds Arabic Discourse Treebank. It is a big project and I should challenge the shortage of Arabic resources and the specialist researchers.   <br>

 <br>
All the best,<br>
Amal====================<br>
Amal Al-Saif<br>
PhD Student<br>
Artificial Intelligence - NLP<br>
School of Computing<br>
University of Leeds<br>
Leeds, LS2 9JT<br>
<a href="mailto:assaif@comp.leeds.ac.uk">assaif@comp.leeds.ac.uk</a><br>
Tel (shared): +44 (0)113 343 6818<br>
Fax.(shared): +44 (0)113 343 5468<br>
<br>
<br>
<br>
<br>
________________________________<br>
From: Waleed Oransa <<a href="mailto:woransa@gmail.com">woransa@gmail.com</a>><br>
To: Hamed Al-Suhli <<a href="mailto:hamed@e3rab.com">hamed@e3rab.com</a>><br>
Cc: "<a href="mailto:corpora@uib.no">corpora@uib.no</a>" <<a href="mailto:corpora@uib.no">corpora@uib.no</a>><br>
Sent: Tue, 17 November, 2009 20:07:22<br>
Subject: Re: [Corpora-List] Proposal for initiating a global non continentalArabic Language Academy<br>
<br>
Hello Hamed and all,<br>
<br>
Here is a voice chat application that we can use, not sure if this is<br>
the best or there is something better. Also we can consider skype<br>
since it is a free option.<br>
<br>
<a href="http://all2chat.com/arabic/servers/" target="_blank">http://all2chat.com/arabic/servers/</a><br>
<br>
Yours,<br>
Waleed<br>
<br>
On Tue, Nov 17, 2009 at 9:30 PM, Kais Dukes <<a href="mailto:sckd@leeds.ac.uk">sckd@leeds.ac.uk</a>> wrote:<br>
> Hello Hamed,<br>
><br>
> I can answer this from a technology point of view. In the longer term, I suggest moving this conversation off the "corpora" mailing list and setting up a dedicated e-mail list for this project. However, in the short term, it is quite important to get things moving (and simply!), as a lot of interest has been expressed. Setting up a group to study Arabic, and especially Quranic Arabic sounds like a positive project which would benefit a great many people.<br>

><br>
> Some things I would suggest:<br>
><br>
> 1) Keep things simple at the start. A good idea might be a message board where people can start to have discussions. However, this does require people to log in / log out. Ideally a mailing list is required, and also a website. Wordpress might be a good place to start, at least initially.<br>

><br>
> 2) For more long term, given that from what I understand there will be a computational aspect to this, I would suggest hosting any code on a widely accessible code repository. Both sourceforge or google code seem to be popular choices for this.<br>

><br>
> 3) From a technical point of view, here is what would be needed long term:<br>
> - a mailing list<br>
> - a website<br>
> - a code repository<br>
> - possibly a message board where anyone can post<br>
><br>
> With regards to what actual technology is required for a language research website ... I would think that would depend on the skill set of those developing and maintaining it! Many good open source web projects use PHP, which is pretty popular these days as a web platform. However, I think given that this is all very early days, probably what might be a good idea would be as you suggest to hold an initial online meeting off the corpora mailing list where things like this can be discussed further. Another thing to think about is private vs public hosting. If you are putting together a language website, this could either be hosted privately (e.g. a at University) or else publically (such as part of google code or sourceforge). Public hosting is cheap, easy and fast to set up, and they give you a platform / infrastructure for e-mail lists, discussion groups, code hosting etc. However, you do have more control if you are affiliated with a University of<br>

 example and host this yourself.<br>
><br>
> Feel free to take the rest of this discussion offline with me, as it does sound its starting to get a bit off topic for the corpora mailing list :-)<br>
><br>
> Kind Regards,<br>
><br>
> -- Kais Dukes<br>
> School Of Computing<br>
> University of Leeds<br>
> <a href="http://quran.uk.net" target="_blank">http://quran.uk.net</a> - The Quranic Arabic Corpus<br>
> ________________________________<br>
> From: Hamed Al-Suhli [<a href="mailto:hamed@e3rab.com">hamed@e3rab.com</a>]<br>
> Sent: 17 November 2009 19:00<br>
> To: Kais Dukes<br>
> Cc: <a href="mailto:corpora@uib.no">corpora@uib.no</a><br>
> Subject: Re: Proposal for initiating a global non continentalArabic Language Academy<br>
><br>
> Dear Kais,<br>
><br>
> I monitored your work with interesting, and you are welcomed.<br>
> As a professional programmer do you have any suggestion for our online platform, the website? open source solution for future development are essential.<br>
> "unfortunately, I'm not a dot net person".<br>
><br>
> On Tue, Nov 17, 2009 at 8:37 PM, Kais Dukes <<a href="mailto:sckd@leeds.ac.uk">sckd@leeds.ac.uk</a><mailto:<a href="mailto:sckd@leeds.ac.uk">sckd@leeds.ac.uk</a>>> wrote:<br>
> Dear Hamed,<br>
><br>
><br>
><br>
> I am working on the "Quranic Arabic Corpus", a research project at the University of Leeds where we are mapping the morphology, syntax and Arabic grammar of the Quran (<a href="http://quran.uk.net" target="_blank">http://quran.uk.net</a>). So far we have applied computational tools for Arabic corpora to automatically tag and then manually verify each word for part-of-speech and morphological inflection features. We are also working on a dependency treebank of the Quran using traditional Arabic syntax (i'rab).<br>

><br>
><br>
><br>
> >From what I understand, as part of your proposal you mention the aim of studying Quranic Arabic. As such, I would be more than happy to be part of this proposal, it sounds directly relevant to our current research here.<br>

><br>
><br>
><br>
> Do please let me know if I can be of any assistance with this - I would like to be involved.<br>
><br>
><br>
><br>
> Kind Regards,<br>
><br>
><br>
><br>
> Kais Dukes<br>
><br>
> School of Computing<br>
><br>
> University of Leeds<br>
><br>
> <a href="http://quran.uk.net" target="_blank">http://quran.uk.net</a> - The Quranic Arabic Corpus<br>
><br>
><br>
><br>
> ---------- Forwarded message ----------<br>
> From: Hamed Al-Suhli <<a href="mailto:hamed@e3rab.com">hamed@e3rab.com</a><mailto:<a href="mailto:hamed@e3rab.com">hamed@e3rab.com</a>><mailto:<a href="mailto:hamed@e3rab.com">hamed@e3rab.com</a><mailto:<a href="mailto:hamed@e3rab.com">hamed@e3rab.com</a>>>><br>

> Date: Tue, Nov 17, 2009 at 12:18 AM<br>
> Subject: Re: [Corpora-List] Proposal for initiating a global non continentalArabic Language Academy<br>
> To: Oliver Mason <<a href="mailto:O.Mason@bham.ac.uk">O.Mason@bham.ac.uk</a><mailto:<a href="mailto:O.Mason@bham.ac.uk">O.Mason@bham.ac.uk</a>><mailto:<a href="mailto:O.Mason@bham.ac.uk">O.Mason@bham.ac.uk</a><mailto:<a href="mailto:O.Mason@bham.ac.uk">O.Mason@bham.ac.uk</a>>>><br>

><br>
> Dear All,<br>
><br>
> Thank you for responding, however many issues have been raised and I'll discuss them one by one.<br>
> 1- why Islamic tending?<br>
> As I mentioned and Dr.Nizar declared there are tow directions for standarizing  Arabic nowadays, the modern standard Arabic VS the Quranic standard Arabic.<br>
> Both are not spoken widely and the modern standard Arabic still not yet completed, in spite of some proposals for regional dialects to became an independent languages the standard Arabic is the only written and widely dominated the culture and formal usage.<br>

> non Muslim Arabs writings are the only non Quranic Arabic writing till the end of 19th century, when some Arabic Muslims nationalists start writing without the restrict Arabic linguistic rules, which lead after a century to non restricted Arabic language we called modern Arabic.<br>

> because of Quran the modern Arabic can't eleminate the standard Naho (syntax) or Sarf (etymological system), and it still leak of precise or standards.<br>
> Thou my proposal centralized by the hold on with well standarized Quranic Arabic and completion of its missing modern "computational, etymological and semantic" standarizations.<br>
><br>
> 2-The proposal definitely not limited or restricted to Muslims.<br>
><br>
> 3- The fund and the Full outlines of the establishment:<br>
> let's take the thing step by step, we need [1]enough enthusiasm professional founders and [2]temporary online platform [3] arranging an appointment for first meeting [4]proposing outlines and manager(s) for the meeting.<br>

> I can offer the temporary online platform<br>
> and we are discussing the other requirements.<br>
><br>
><br>
><br>
><br>
><br>
> --<br>
> Hamed Al-Suhli<br>
> <a href="http://e3rab.com" target="_blank">http://e3rab.com</a><br>
><br>
> _______________________________________________<br>
> Corpora mailing list<br>
> <a href="mailto:Corpora@uib.no">Corpora@uib.no</a><br>
> <a href="http://mailman.uib.no/listinfo/corpora" target="_blank">http://mailman.uib.no/listinfo/corpora</a><br>
><br>
<br>
_______________________________________________<br>
Corpora mailing list<br>
<a href="mailto:Corpora@uib.no">Corpora@uib.no</a><br>
<a href="http://mailman.uib.no/listinfo/corpora" target="_blank">http://mailman.uib.no/listinfo/corpora</a><br>
<br>
<br>
<br>
<br>
-------------- next part --------------<br>
A non-text attachment was scrubbed...<br>
Name: not available<br>
Type: text/html<br>
Size: 11699 bytes<br>
Desc: not available<br>
URL: <<a href="http://www.uib.no/mailman/public/corpora/attachments/20091118/308680e1/attachment.txt" target="_blank">http://www.uib.no/mailman/public/corpora/attachments/20091118/308680e1/attachment.txt</a>><br>
<br>
------------------------------<br>
<br>
Message: 2<br>
Date: Wed, 18 Nov 2009 12:59:33 +0200<br>
From: "Tuomo Kakkonen" <<a href="mailto:tkakkone@cs.joensuu.fi">tkakkone@cs.joensuu.fi</a>><br>
Subject: [Corpora-List] Job: PostDoc Researcher, University of<br>
        Joensuu,        Finland<br>
To: <<a href="mailto:corpora@uib.no">corpora@uib.no</a>><br>
<br>
Hello<br>
<br>
The educational technology research group, edTech delta<br>
(<a href="http://cs.joensuu.fi/edtech/" target="_blank">http://cs.joensuu.fi/edtech/</a>), at the University of Joensuu is seeking to<br>
expand its research team in areas related to text mining, information<br>
extraction and sentiment analysis. The successful candidate will work in<br>
research projects entitled "Towards e-leadership: higher profitability<br>
through innovative management and leadership systems" and "Detecting and<br>
visualizing changes in emotions in texts".<br>
<br>
Please, see the job announcement at<br>
<a href="http://www.joensuu.fi/ajankohtaista/tyopaikat2.php?id=2281" target="_blank">http://www.joensuu.fi/ajankohtaista/tyopaikat2.php?id=2281</a> for further<br>
details.<br>
The closing date for applications for the PostDoc position has been extended<br>
until December 14th, 2009.<br>
<br>
Best regards,<br>
 Tuomo Kakkonen<br>
<br>
*********************<br>
Tuomo Kakkonen<br>
Researcher & Project Manager, PhD<br>
EdTech research group<br>
Department of Computer Science and Statistics<br>
University of Joensuu, Finland<br>
<br>
<br>
<br>
<br>
<br>
------------------------------<br>
<br>
Message: 3<br>
Date: Wed, 18 Nov 2009 12:30:25 -0600<br>
From: Lisa Hesterberg <<a href="mailto:lisahesterberg2013@u.northwestern.edu">lisahesterberg2013@u.northwestern.edu</a>><br>
Subject: [Corpora-List] Arabic Broken Plural Dictionary<br>
To: <a href="mailto:CORPORA@uib.no">CORPORA@uib.no</a><br>
<br>
Hello,<br>
<br>
I am currently working on a project involving the morphology of Arabic<br>
broken plurals. Does anyone know of a dictionary of broken plurals that is<br>
publicly available?<br>
<br>
Thank you,<br>
<br>
Lisa Hesterberg<br>
Department of Linguistics<br>
Northwestern University<br>
-------------- next part --------------<br>
A non-text attachment was scrubbed...<br>
Name: not available<br>
Type: text/html<br>
Size: 282 bytes<br>
Desc: not available<br>
URL: <<a href="http://www.uib.no/mailman/public/corpora/attachments/20091118/d3d65633/attachment.txt" target="_blank">http://www.uib.no/mailman/public/corpora/attachments/20091118/d3d65633/attachment.txt</a>><br>
<br>
------------------------------<br>
<br>
Message: 4<br>
Date: Wed, 18 Nov 2009 21:27:52 +0100<br>
From: Gert De Sutter <<a href="mailto:gert.desutter@hogent.be">gert.desutter@hogent.be</a>><br>
Subject: [Corpora-List] Call for participation: Methodological<br>
        Advances in corpus-based Translation Studies (Ghent, 8-9 January 2010)<br>
To: <a href="mailto:corpora@uib.no">corpora@uib.no</a><br>
<br>
CALL FOR PARTICIPATION<br>
<br>
*Methodological Advances in corpus-based Translation Studies (MATS 2010)*<br>
<br>
Hosted by University College Ghent (Belgium)<br>
January 8 and 9, 2010<br>
<br>
Conference URL: <a href="http://veto.hogent.be/actua/mats2010/" target="_blank">http://veto.hogent.be/actua/mats2010/</a><br>
<br>
<br>
The symposium focuses on:<br>
<br>
- The relationship between non-translated texts and translated texts in<br>
one language<br>
- The relationship between source texts and target texts<br>
- Innovative methods and techniques for collecting and analysing data in<br>
Translation Studies<br>
<br>
<br>
Plenary speakers<br>
<br>
- Silvia Bernardini (University of Bologna at Forlì)<br>
- Andrew Chesterman (University of Helsinki)<br>
<br>
<br>
More information about registration, social programme, venue on the MATS<br>
2010 website: <a href="http://veto.hogent.be/acorpctua/mats2010/" target="_blank">http://veto.hogent.be/acorpctua/mats2010/</a><br>
<br>
<br>
Background<br>
<br>
The introduction of a corpus-based methodology in the field of<br>
Translation Studies (Baker 1993) gave rise to a large number of<br>
empirical studies that investigate the fundamental characteristics of<br>
translated texts and their relationship to their source texts and<br>
non-translated texts. These studies have yielded interesting insights<br>
into the nature of translated language and the translation process, such<br>
as the so-called translation universals, the ideology of translation and<br>
stylistic differences between translators.<br>
<br>
Nevertheless, important methodological and conceptual challenges lie<br>
ahead. Some languages, for instance, are less well-studied within<br>
corpus-based Translation Studies. Obviously, in order to empirically<br>
verify general hypotheses about translation products and processes, as<br>
many languages as possible have to be studied.<br>
<br>
In addition, some general hypotheses, like the explicitation<br>
hypothesis, need conceptual refinement: to what extent, for instance, is<br>
explicitation at syntactic level identical to explicitation at<br>
discursive level? Most importantly, how can general hypotheses be put to<br>
the test or, in other words, how do we 'translate? (operationalise)<br>
hypotheses so that they are empirically testable in a corpus?<br>
The two-day symposium therefore wants to encourage corpus-based work on<br>
translations in less well-studied languages as well as corpus-based work<br>
that pushes methodological and conceptual frontiers in Translation<br>
Studies. Possible questions / hypotheses include (but are not limited<br>
to) untranslatability or implicitation, deictic shifts in translation,<br>
information structure asymmetries between source and target texts,<br>
register differences within translated language. More information can be<br>
found on the conference website.<br>
<br>
<br>
<br>
------------------------------<br>
<br>
Message: 5<br>
Date: Wed, 18 Nov 2009 18:53:12 +0100<br>
From: zanca <<a href="mailto:zanca@unisi.it">zanca@unisi.it</a>><br>
Subject: Re: [Corpora-List] Word lists for Wordsmith Tools<br>
To: Enrico Grazzi <<a href="mailto:enricograzzi@alice.it">enricograzzi@alice.it</a>><br>
Cc: <a href="mailto:corpora@uib.no">corpora@uib.no</a><br>
<br>
Hi Enrico,<br>
you can download a wordlist and cluster list of the of the BNC from the<br>
Wordsmith Tools website.<br>
There is also a wordlist of the Guardian<br>
<br>
<a href="http://www.lexically.net/wordsmith/" target="_blank">http://www.lexically.net/wordsmith/</a><br>
<br>
<br>
regards<br>
<br>
Cesare zanca<br>
<br>
<br>
Enrico Grazzi ha scritto:<br>
><br>
> Dear all,<br>
><br>
> could anybody tell me how to get the wordlist of the BNC in .txt<br>
> format (or of any other general corpus), so that I can use it on<br>
> Wordsmith Tools to find the keywords in my corpora? Thank you, so much!<br>
><br>
><br>
><br>
> Best,<br>
><br>
><br>
><br>
> Enrico Grazzi<br>
><br>
> _________________________________________<br>
><br>
> Dott. Enrico Grazzi<br>
><br>
> Università degli Studi /Roma Tre/<br>
><br>
> Dipartimento di Linguistica<br>
><br>
> Via Ostiense, 234<br>
><br>
> 00143 - Roma<br>
><br>
> Tel. 06.57338571<br>
><br>
> Fax: 06.57338344<br>
><br>
> E-mail: <a href="mailto:egrazzi@uniroma3.it">egrazzi@uniroma3.it</a><br>
><br>
> <a href="http://host.uniroma3.it/dipartimenti/linguistica/" target="_blank">http://host.uniroma3.it/dipartimenti/linguistica/</a><br>
><br>
> _______________________________________<br>
><br>
><br>
><br>
><br>
><br>
> ------------------------------------------------------------------------<br>
><br>
> _______________________________________________<br>
> Corpora mailing list<br>
> <a href="mailto:Corpora@uib.no">Corpora@uib.no</a><br>
> <a href="http://mailman.uib.no/listinfo/corpora" target="_blank">http://mailman.uib.no/listinfo/corpora</a><br>
><br>
> ------------------------------------------------------------------------<br>
><br>
><br>
> Internal Virus Database is out of date.<br>
> Checked by AVG.<br>
> Version: 8.0.147 / Virus Database: 270.14.63/2500 - Release Date: 13/11/2009 7.54<br>
><br>
<br>
<br>
--<br>
<br>
Cesare Zanca<br>
Dip. di Filologia e Critica della Letteratura<br>
Universita' di Siena<br>
Via Roma, 56<br>
<br>
e-mail: <a href="mailto:zanca@unisi.it">zanca@unisi.it</a><br>
Tel. + 39 0577 234799<br>
<br>
<br>
<br>
<br>
------------------------------<br>
<br>
Message: 6<br>
Date: Thu, 19 Nov 2009 10:19:32 +0800<br>
From: "wilson@csse" <<a href="mailto:wilson@csse.uwa.edu.au">wilson@csse.uwa.edu.au</a>><br>
Subject: [Corpora-List] 2nd Call for Chapter - Ontology Learning and<br>
        Knowledge Discovery Using the Web<br>
To: <a href="mailto:CORPORA@uib.no">CORPORA@uib.no</a><br>
<br>
SECOND CALL FOR CHAPTERS<br>
(Proposals Submission Deadline: 15 DECEMBER 2009)<br>
<br>
Ontology Learning and Knowledge Discovery Using the Web: Challenges and<br>
Recent Advances<br>
<br>
A book edited by Wilson Wong, Wei Liu and Mohammed Bennamoun<br>
University of Western Australia, Australia<br>
<a href="http://explorer.csse.uwa.edu.au/editedbook" target="_blank">http://explorer.csse.uwa.edu.au/editedbook</a><br>
<br>
Introduction<br>
========================================================================================<br>
Ontologies provide formal specifications of what might exist in a domain to<br>
ensure reusability and interoperability of multiple heterogeneous systems.<br>
Ontologies form an indispensable part of the Semantic Web standard stack.<br>
While the Semantic Web is still our vision into the future, ontologies have<br>
already found a myriad of applications such as document retrieval, question<br>
answering, image retrieval, agent interoperability and document annotation.<br>
In recent years, automatic ontology learning from text has provided support<br>
and relief for knowledge engineers from the labourious task of manually<br>
engineering of ontologies. Ontology learning research, an area integrating<br>
advances from information retrieval, text mining, data mining, machine<br>
learning and natural language processing, has attracted increasing interests<br>
from a wide spectrum of application domains (e.g. bioinformatics,<br>
manufacturing). Being a rapidly growing area, it is crucial to collect the<br>
recent advances in tools and technologies in ontology learning and related<br>
areas.<br>
<br>
Objective Of The Book<br>
========================================================================================<br>
The main objective of this book is to provide relevant theoretical<br>
foundations, and disseminate new research findings and expert views on the<br>
remaining challenges in ontology learning. In particular, the book focuses<br>
on the following questions:<br>
# Can ontology learning continue to rely on techniques borrowed from related<br>
areas that were conceived for other purposes? Has the time arrived for us to<br>
look at certain peculiar requirements of ontology learning and develop<br>
specific techniques to meet these requirements?<br>
# Lightweight ontologies are the most common type of ontologies in a variety<br>
of existing Semantic Web applications (e.g. knowledge management, document<br>
retrieval, communities of practice, data integration). Can these lightweight<br>
ontologies be easily extended to formal ones? If so, how?<br>
# The poor coverage, rarity and maintenance cost related to manually-created<br>
resources such as semantic lexicons (e.g. WordNet, UMLS) and text corpora<br>
(e.g. BNC, GENIA corpus) have prompted an increasing number of researchers<br>
to turn to dynamic Web data for ontology learning. There is currently a lack<br>
of study concentrating on the systematic use of Web data as background<br>
knowledge for all phases of ontology learning. How do we know if we have the<br>
necessary background knowledge to carry out all our ontology learning tasks?<br>
Where do we look for more background knowledge if we know that what we have<br>
is inadequate?<br>
# More and more practitioners in the domain of biology, health care,<br>
chemistry, manufacturing, etc are looking up to ontology learning techniques<br>
for solutions to their knowledge sharing and reusability needs. How much<br>
more difficult is it to automatically learn ontologies from news articles,<br>
as compared to clinical notes or biomedical literature? To what extent can<br>
the current techniques meet the requirements of learning from texts across<br>
different domains? Is the field of automatic ontology learning from text<br>
ready for the industry?<br>
<br>
Target Audience<br>
========================================================================================<br>
This proposed book will be an invaluable resource as a library or personal<br>
reference for a wide range of audience, including, graduate students,<br>
researchers and industrial practitioners. Postgraduate students who are in<br>
the process of looking for future research directions, and carving out their<br>
own niche area will find this book particularly useful. Due to the detailed<br>
scope and wide coverage of the book, it also has the potential of being an<br>
upper-level course supplement for senior undergraduate students in<br>
Artificial Intelligence, and a resource for lecturers in Knowledge<br>
Acquisition, Knowledge Representation and Reasoning, Text Mining,<br>
Information Extraction, and Ontology Learning.<br>
<br>
Recommended Topics Include, But Are Not Limited To<br>
========================================================================================<br>
Area 1: Text Processing<br>
# Web data pre-processing<br>
# Noisy text analytics<br>
# Text annotation/Sentence parsing<br>
# Textual content extraction/Boilerplates removal<br>
# Automatic corpus construction<br>
<br>
Area 2: Taxonomy Construction/Concept Formation<br>
# Named entity recognition/noun phrase chunking<br>
# Feature-based/featureless similarity and distance measures<br>
# Term recognition/term extraction/terminology mining<br>
# Cluster analysis/term clustering<br>
# Entity disambiguation<br>
# Relevance/contrastive analysis<br>
# Latent semantic analysis<br>
# Other machine learning-based techniques<br>
# Other corpus-based techniques<br>
<br>
Area 3: Relation and Axiom Discovery/Ontology Languages<br>
# Lexico-syntactic patterns<br>
# Use of dynamic Web data (e.g. Wikipedia mining, online dictionaries)<br>
# Sub-categorisation frames<br>
# Association rules mining<br>
# Inductive logic programming<br>
# Other corpus-based techniques<br>
# Logic-based/frame-based/markup ontology languages<br>
<br>
Area 4: Applications of Ontologies<br>
# Bioinformatics<br>
# Risk management<br>
# Manufacturing<br>
# Health care<br>
# Other relevant application areas<br>
<br>
Submission Procedure<br>
========================================================================================<br>
Researchers and practitioners are invited to submit on or before 15 DECEMBER<br>
2009, a 2-3 page chapter proposal clearly explaining the mission and<br>
concerns together with a tentative organisation (i.e. section titles with<br>
section summaries) of their proposed chapter. Authors of accepted proposals<br>
will be notified by 15 JANUARY 2010 about the status of their proposals.<br>
Authors of accepted proposals will be sent guidelines and templates to<br>
prepare the full chapter of 8,000 - 10,000 words. Full chapters are expected<br>
to be submitted by 15 MARCH 2010. All submitted full chapters will be<br>
reviewed on a double-blind review basis. All proposals and chapters should<br>
be typewritten in English in APA style and be submitted in Microsoft Word®<br>
format to <a href="mailto:wilson@csse.uwa.edu.au">wilson@csse.uwa.edu.au</a>. Unfortunately, LaTex files cannot be<br>
accepted. Contributors may also be requested to serve as reviewers for this<br>
project. This book is scheduled to be published by IGI Global (formerly Idea<br>
Group Inc.). For additional information regarding the publisher, please<br>
visit <a href="http://www.igi-global.com/requests/details.asp?ID=724" target="_blank">http://www.igi-global.com/requests/details.asp?ID=724</a>. This<br>
publication is anticipated to be released late 2010.<br>
<br>
Important Dates<br>
========================================================================================<br>
15 DECEMBER 2009 Proposal Submission Deadline<br>
15 JANUARY 2010 Notification of Acceptance<br>
15 MARCH 2010 Full Chapter Submission<br>
15 JULY 2010 Review Results Returned<br>
15 AUGUST 2010 Final Chapter Submission<br>
<br>
Editorial Advisory Board Members<br>
========================================================================================<br>
Dr Christopher Brewster, Aston University, UK<br>
Associate Professor Chunyu Kit, City University of Hong Kong, Hong Kong<br>
Professor Mary-Anne Williams, University of Technology Sydney, Australia<br>
Professor Philipp Cimiano, University of Bielefeld, Germany<br>
Professor Sophia Ananiadou, University of Manchester, UK<br>
Professor Tharam Dillon, Curtin University of Technology, Australia<br>
Dr Venkata Subramaniam, IBM India Research, India<br>
<br>
Inquiries and Submissions<br>
========================================================================================<br>
Wilson Wong<br>
School of Computer Science and Software Engineering<br>
M002 University of Western Australia<br>
35 Stirling Highway<br>
CRAWLEY 6009 WA<br>
Australia<br>
Fax: +61-8-6488-1089<br>
E-mail: <a href="mailto:wilson@csse.uwa.edu.au">wilson@csse.uwa.edu.au</a><br>
Up-to-date information about this call is available at<br>
<a href="http://explorer.csse.uwa.edu.au/editedbook" target="_blank">http://explorer.csse.uwa.edu.au/editedbook</a><br>
-------------- next part --------------<br>
A non-text attachment was scrubbed...<br>
Name: not available<br>
Type: text/html<br>
Size: 8673 bytes<br>
Desc: not available<br>
URL: <<a href="http://www.uib.no/mailman/public/corpora/attachments/20091119/cad95c4c/attachment.txt" target="_blank">http://www.uib.no/mailman/public/corpora/attachments/20091119/cad95c4c/attachment.txt</a>><br>
<br>
----------------------------------------------------------------------<br>
Send Corpora mailing list submissions to<br>
        <a href="mailto:corpora@uib.no">corpora@uib.no</a><br>
<br>
To subscribe or unsubscribe via the World Wide Web, visit<br>
        <a href="http://mailman.uib.no/listinfo/corpora" target="_blank">http://mailman.uib.no/listinfo/corpora</a><br>
or, via email, send a message with subject or body 'help' to<br>
        <a href="mailto:corpora-request@uib.no">corpora-request@uib.no</a><br>
<br>
You can reach the person managing the list at<br>
        <a href="mailto:corpora-owner@uib.no">corpora-owner@uib.no</a><br>
<br>
When replying, please edit your Subject line so it is more specific<br>
than "Re: Contents of Corpora digest..."<br>
<br>
<br>
_______________________________________________<br>
Corpora mailing list<br>
<a href="mailto:Corpora@uib.no">Corpora@uib.no</a><br>
<a href="http://mailman.uib.no/listinfo/corpora" target="_blank">http://mailman.uib.no/listinfo/corpora</a><br>
<br>
<br>
End of Corpora Digest, Vol 29, Issue 19<br>
***************************************<br>
</blockquote></div><br><br clear="all"><br>-- <br>Emad Soliman Ali Mohamed<br>aka Emad Nawfal<br>Doctoral Student, Department of Linguistics,<br>Indiana University, Bloomington<br><a href="http://jones.ling.indiana.edu/~emadnawfal">http://jones.ling.indiana.edu/~emadnawfal</a><br>