<html xmlns:v="urn:schemas-microsoft-com:vml" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40">

<head>
<meta http-equiv=Content-Type content="text/html; charset=us-ascii">
<meta name=Generator content="Microsoft Word 12 (filtered medium)">
<style>
<!--
 /* Font Definitions */
 @font-face
        {font-family:Wingdings;
        panose-1:5 0 0 0 0 0 0 0 0 0;}
@font-face
        {font-family:"Cambria Math";
        panose-1:2 4 5 3 5 4 6 3 2 4;}
@font-face
        {font-family:Calibri;
        panose-1:2 15 5 2 2 2 4 3 2 4;}
@font-face
        {font-family:Tahoma;
        panose-1:2 11 6 4 3 5 4 4 2 4;}
 /* Style Definitions */
 p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0cm;
        margin-bottom:.0001pt;
        font-size:12.0pt;
        font-family:"Times New Roman","serif";}
a:link, span.MsoHyperlink
        {mso-style-priority:99;
        color:blue;
        text-decoration:underline;}
a:visited, span.MsoHyperlinkFollowed
        {mso-style-priority:99;
        color:purple;
        text-decoration:underline;}
span.EmailStyle17
        {mso-style-type:personal-reply;
        font-family:"Calibri","sans-serif";
        color:#1F497D;}
.MsoChpDefault
        {mso-style-type:export-only;}
@page Section1
        {size:612.0pt 792.0pt;
        margin:70.85pt 70.85pt 70.85pt 70.85pt;}
div.Section1
        {page:Section1;}
-->
</style>
<!--[if gte mso 9]><xml>
 <o:shapedefaults v:ext="edit" spidmax="1026" />
</xml><![endif]--><!--[if gte mso 9]><xml>
 <o:shapelayout v:ext="edit">
  <o:idmap v:ext="edit" data="1" />
 </o:shapelayout></xml><![endif]-->
</head>

<body lang=NL-BE link=blue vlink=purple>

<div class=Section1>

<p class=MsoNormal><span lang=EN-US style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>The International Journal of Computer Linguistics is in the ISI.
So, it is in the authors’ (and the journal’s) interest to have a
citation to their article. At the same time, chances are higher readers will
use the reference if they feel they have easy access to it. So, I’d go
for something like the following:<o:p></o:p></span></p>

<p class=MsoNormal><span lang=EN-US style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'><o:p> </o:p></span></p>

<p class=MsoNormal><span lang=EN-US style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Al-Sulaiti, L., & Atwell, E. S. (2006). The design of a
corpus of contemporary Arabic. International Journal of Corpus Linguistics,
11(2), 135-171. Retrieved March 7, 2013, from  <a
href="http://www.comp.leeds.ac.uk/eric/latifa/research.htm">http://www.comp.leeds.ac.uk/eric/latifa/research.htm</a>.<o:p></o:p></span></p>

<p class=MsoNormal><span lang=EN-US style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'><o:p> </o:p></span></p>

<p class=MsoNormal><span lang=EN-US style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>In this way you have the best of both worlds </span><span
lang=EN-US style='font-size:11.0pt;font-family:Wingdings;color:#1F497D'>J</span><span
lang=EN-US style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'><o:p></o:p></span></p>

<p class=MsoNormal><span lang=EN-US style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'><o:p> </o:p></span></p>

<p class=MsoNormal><span lang=EN-US style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Best, marc<o:p></o:p></span></p>

<p class=MsoNormal><span lang=EN-US style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'><o:p> </o:p></span></p>

<div style='border:none;border-top:solid #B5C4DF 1.0pt;padding:3.0pt 0cm 0cm 0cm'>

<p class=MsoNormal><b><span lang=EN-US style='font-size:10.0pt;font-family:
"Tahoma","sans-serif"'>From:</span></b><span lang=EN-US style='font-size:10.0pt;
font-family:"Tahoma","sans-serif"'> corpora-bounces@uib.no
[mailto:corpora-bounces@uib.no] <b>On Behalf Of </b>M. Rezaei<br>
<b>Sent:</b> 07 March 2013 09:30<br>
<b>To:</b> corpora@uib.no<br>
<b>Subject:</b> Re: [Corpora-List] Question: Citing Linguistic Corpora<o:p></o:p></span></p>

</div>

<p class=MsoNormal><o:p> </o:p></p>

<div>

<div>

<p class=MsoNormal><span style='font-family:"Arial","sans-serif";color:#222222'>Dear
Adam, Eric, and Marc</span><o:p></o:p></p>

</div>

<div>

<p class=MsoNormal><span style='font-family:"Arial","sans-serif";color:#222222'>Thank
you for your responses. </span><o:p></o:p></p>

</div>

<div>

<p class=MsoNormal><o:p> </o:p></p>

</div>

<div>

<p class=MsoNormal><span style='font-family:"Arial","sans-serif";color:#222222'>Suppose
I use the Corpus of Contemporary Arabic for some NLP or corpus linguistics
purpose, would it be strange to cite it as follows:</span><o:p></o:p></p>

</div>

<div>

<p class=MsoNormal><span style='font-family:"Arial","sans-serif";color:#222222'>Al-Sulaiti,
L., & Atwell, E. S. (2006). Corpus of Contemporary Arabic (CCA). Leeds, UK:
University of Leeds. Retrieved from <a
href="http://www.comp.leeds.ac.uk/eric/latifa/research.htm">http://www.comp.leeds.ac.uk/eric/latifa/research.htm</a></span><o:p></o:p></p>

</div>

<div>

<p class=MsoNormal><o:p> </o:p></p>

</div>

<div>

<p class=MsoNormal><span style='font-family:"Arial","sans-serif";color:#222222'>instead
of:</span><o:p></o:p></p>

</div>

<div>

<p class=MsoNormal><span style='font-size:8.0pt;font-family:"Arial","sans-serif";
color:#222222'>Al-Sulaiti, L., & Atwell, E. S. (2006). The design of a
corpus of contemporary Arabic. <i>International Journal of Corpus
Linguistics</i>, <i>11</i>(2), 135-171.</span><o:p></o:p></p>

</div>

<div>

<p class=MsoNormal><o:p> </o:p></p>

</div>

<div>

<p class=MsoNormal>?<o:p></o:p></p>

</div>

<p class=MsoNormal><o:p> </o:p></p>

<div>

<p class=MsoNormal>On Thu, Mar 7, 2013 at 11:33 AM, Marc Brysbaert <<a
href="mailto:marc.brysbaert@ugent.be" target="_blank">marc.brysbaert@ugent.be</a>>
wrote:<o:p></o:p></p>

<div>

<div>

<p class=MsoNormal style='mso-margin-top-alt:auto;mso-margin-bottom-alt:auto'><span
lang=EN-US style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Hi,</span><o:p></o:p></p>

<p class=MsoNormal style='mso-margin-top-alt:auto;mso-margin-bottom-alt:auto'><span
lang=EN-US style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'> </span><o:p></o:p></p>

<p class=MsoNormal style='mso-margin-top-alt:auto;mso-margin-bottom-alt:auto'><span
lang=EN-US style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Researchers get most credit for their work when it is published
in a journal that features in ISI or Scopus, as it is then used for all types
of metrics (whether you like this or not). From my own experience, I’ve
noticed that it is not so easy, however, to get manuscripts on corpora (or word
frequency lists) published, even though they are well cited. Does anyone have a
list of ISI journals that publish information on corpora? Thus far I have
published most of my findings in Behavior Research Methods, but this is aimed
at a psychological audience (and hence will only accept papers that are interesting
for them).</span><o:p></o:p></p>

<p class=MsoNormal style='mso-margin-top-alt:auto;mso-margin-bottom-alt:auto'><span
lang=EN-US style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'> </span><o:p></o:p></p>

<p class=MsoNormal style='mso-margin-top-alt:auto;mso-margin-bottom-alt:auto'><span
lang=EN-US style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Best, marc</span><o:p></o:p></p>

</div>

</div>

<div>

<p class=MsoNormal><o:p> </o:p></p>

</div>

<div>

<div>

<p class=MsoNormal>On Thu, Mar 7, 2013 at 11:04 AM, Eric Atwell <<a
href="mailto:E.S.Atwell@leeds.ac.uk" target="_blank">E.S.Atwell@leeds.ac.uk</a>> wrote:<o:p></o:p></p>

<p class=MsoNormal>Morteza,<br>
<br>
This question is timely in the UK where we are preparing for REF.<br>
Whatever Corpus Linguists may think, the wider academic world expects<br>
citations of published journal/conference papers or books. So, when a<br>
corpus is created, the developers should also publish a paper or book on the
research undertaken to develop the corpus, and this is what you<br>
should cite. Even if you don't directly quote from the paper, you are<br>
citing the academic research idea embodied in the paper. Sometimes a corpus
project can lead to several publications.<br>
It is good practice for creators of a corpus to nominate a specific paper<br>
whcih should be cited by users of the corpus, e.g. on the website where<br>
you get the corpus from. This helps people like you who want to know<br>
what to cite; and it helps the corpus creators to accumulate due credit for
their work. For example for REF, we nominate up to 4 key papers for<br>
assessment, so it helps if others cite these specific 4 papers.<br>
<br>
Eric Atwell, Leeds University<o:p></o:p></p>

<div>

<p class=MsoNormal><span style='color:#888888'>-- </span><o:p></o:p></p>

</div>

<p class=MsoNormal><span style='color:#888888'>Eric Atwell, Associate
Professor, Language research group,<br>
 I-AIBS Institute for Artificial Intelligence and Biological Systems<br>
 School of Computing, Faculty of Engineering, UNIVERSITY OF LEEDS<br>
 Leeds LS2 9JT, England.        TEL: 0113-3435430
 FAX: 0113-3435468<br>
 WWW: </span><a href="http://www.comp.leeds.ac.uk/eric"
target="_blank">http://www.comp.leeds.ac.uk/eric</a><span style='color:#888888'><br>
      </span><a href="http://www.comp.leeds.ac.uk/nlp"
target="_blank">http://www.comp.leeds.ac.uk/nlp</a><span style='color:#888888'><br>
      </span><a href="http://www.comp.leeds.ac.uk/arabic"
target="_blank">http://www.comp.leeds.ac.uk/arabic</a><o:p></o:p></p>

<p class=MsoNormal> <o:p></o:p></p>

</div>

</div>

<blockquote style='border:none;border-left:solid #CCCCCC 1.0pt;padding:0cm 0cm 0cm 6.0pt;
margin-left:4.8pt;margin-right:0cm'>

<div>

<div>

<p class=MsoNormal style='mso-margin-top-alt:auto;mso-margin-bottom-alt:auto'><span
lang=EN-US style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'> </span><o:p></o:p></p>

<div style='border:none;border-top:solid #B5C4DF 1.0pt;padding:3.0pt 0cm 0cm 0cm'>

<p class=MsoNormal style='mso-margin-top-alt:auto;mso-margin-bottom-alt:auto'><b><span
lang=EN-US style='font-size:10.0pt;font-family:"Tahoma","sans-serif"'>From:</span></b><span
lang=EN-US style='font-size:10.0pt;font-family:"Tahoma","sans-serif"'> <a
href="mailto:corpora-bounces@uib.no" target="_blank">corpora-bounces@uib.no</a>
[mailto:<a href="mailto:corpora-bounces@uib.no" target="_blank">corpora-bounces@uib.no</a>]
<b>On Behalf Of </b>Adam Kilgarriff<br>
<b>Sent:</b> 07 March 2013 08:37<br>
<b>To:</b> M. Rezaei<br>
<b>Cc:</b> <a href="mailto:corpora@uib.no" target="_blank">corpora@uib.no</a><br>
<b>Subject:</b> Re: [Corpora-List] Question: Citing Linguistic Corpora</span><o:p></o:p></p>

</div>

<div>

<div>

<p class=MsoNormal style='mso-margin-top-alt:auto;mso-margin-bottom-alt:auto'> <o:p></o:p></p>

<p class=MsoNormal style='mso-margin-top-alt:auto;mso-margin-bottom-alt:auto'>Dear
Morteza,<o:p></o:p></p>

<div>

<p class=MsoNormal style='mso-margin-top-alt:auto;mso-margin-bottom-alt:auto'> <o:p></o:p></p>

</div>

<div>

<p class=MsoNormal style='mso-margin-top-alt:auto;mso-margin-bottom-alt:auto'>Yes,
you definitely should cite the corpus.<o:p></o:p></p>

</div>

<div>

<p class=MsoNormal style='mso-margin-top-alt:auto;mso-margin-bottom-alt:auto'> <o:p></o:p></p>

</div>

<div>

<p class=MsoNormal style='mso-margin-top-alt:auto;mso-margin-bottom-alt:auto'>It
is always likely that your POS-tagger will have failings because of
characteristics of the corpus it was trained on.  People should be able to
look at it in this light, with an account of how the corpus was prepared,
available to them.<o:p></o:p></p>

</div>

<div>

<p class=MsoNormal style='mso-margin-top-alt:auto;mso-margin-bottom-alt:auto'> <o:p></o:p></p>

</div>

<div>

<p class=MsoNormal style='mso-margin-top-alt:auto;mso-margin-bottom-alt:auto'>Sometimes
there is no obvious way to cite the corpus.  Sometimes a URL is best
(which is what I do for example for the BNC, as the website is long-life and
with full and good documentation, and the only alternative is to a technical
report that no-one is actually going to track down).  As a producer of
corpora, I aim to write them up in a paper that is easy to find and to read and
serves as a reference.<o:p></o:p></p>

</div>

<div>

<p class=MsoNormal style='mso-margin-top-alt:auto;mso-margin-bottom-alt:auto'> <o:p></o:p></p>

</div>

<div>

<p class=MsoNormal style='mso-margin-top-alt:auto;mso-margin-bottom-alt:auto'> Adam<o:p></o:p></p>

</div>

</div>

</div>

</div>

</div>

</blockquote>

<p class=MsoNormal style='mso-margin-top-alt:auto;mso-margin-bottom-alt:auto'>-- <br>
========================================<br>
<a href="http://www.kilgarriff.co.uk/" target="_blank">Adam Kilgarriff</a>    
             <a
href="mailto:adam@lexmasterclass.com" target="_blank">adam@lexmasterclass.com</a> 
                     
                     <br>
Director                    
               <a
href="http://www.sketchengine.co.uk/" target="_blank">Lexical Computing Ltd</a>  
             <br>
Visiting Research Fellow              
  <a href="http://leeds.ac.uk/" target="_blank">University of Leeds</a>  
  <o:p></o:p></p>

<div>

<p class=MsoNormal style='mso-margin-top-alt:auto;mso-margin-bottom-alt:auto'><i><span
style='color:#006600'>Corpora for all</span></i> with <a
href="http://www.sketchengine.co.uk/" target="_blank">the Sketch Engine</a>  
              <o:p></o:p></p>

</div>

<div>

<p class=MsoNormal style='mso-margin-top-alt:auto;mso-margin-bottom-alt:auto'>  
                     <i><a
href="http://www.webdante.com/" target="_blank">DANTE: <span
style='color:#009900'>a lexical database for English</span></a><span
style='color:#009900'> </span>           
     </i><o:p></o:p></p>

</div>

<div>

<p class=MsoNormal>======================================== <o:p></o:p></p>

</div>

<blockquote style='border:none;border-left:solid #CCCCCC 1.0pt;padding:0cm 0cm 0cm 6.0pt;
margin-left:4.8pt;margin-right:0cm'>

<div>

<div>

<div>

<div>

<div>

<p class=MsoNormal style='mso-margin-top-alt:auto;mso-margin-bottom-alt:auto'> <o:p></o:p></p>

<div>

<p class=MsoNormal style='mso-margin-top-alt:auto;mso-margin-bottom-alt:auto'>On
7 March 2013 06:27, M. Rezaei <<a href="mailto:mrezaeis@mehr.sharif.ir"
target="_blank">mrezaeis@mehr.sharif.ir</a>> wrote:<o:p></o:p></p>

<div>

<div>

<p class=MsoNormal style='mso-margin-top-alt:auto;mso-margin-bottom-alt:auto'><span
style='font-family:"Tahoma","sans-serif"'>Dear all,</span><o:p></o:p></p>

</div>

<div>

<p class=MsoNormal style='mso-margin-top-alt:auto;mso-margin-bottom-alt:auto'><span
style='font-family:"Tahoma","sans-serif"'>Salam.</span><o:p></o:p></p>

</div>

<div>

<p class=MsoNormal style='mso-margin-top-alt:auto;mso-margin-bottom-alt:auto'><span
style='font-family:"Tahoma","sans-serif"'>Suppose I use a text corpus and I
extract some statistical information from it or I train a POS tagger based on
it. Well, I have used the corpus, but I have not directly used the paper which
describes it i.e. I have not quoted a paragraph from the paper in my research.
Is there any standard style for citing the corpus itself, as a data set? Is it
a good idea to do so? What about the corpus authors, do they prefer users to
cite their paper rather than the corpus itself?</span><o:p></o:p></p>

</div>

<div>

<p class=MsoNormal style='mso-margin-top-alt:auto;mso-margin-bottom-alt:auto'><span
style='font-family:"Tahoma","sans-serif"'>Looking forward to receiving your
responses.</span><o:p></o:p></p>

</div>

<div>

<p class=MsoNormal style='mso-margin-top-alt:auto;mso-margin-bottom-alt:auto'><span
style='font-family:"Tahoma","sans-serif"'>Best Regards</span><o:p></o:p></p>

</div>

<div>

<p class=MsoNormal style='mso-margin-top-alt:auto;mso-margin-bottom-alt:auto'><span
style='font-family:"Tahoma","sans-serif"'>Morteza Rezaei</span><o:p></o:p></p>

</div>

</div>

</div>

</div>

</div>

</div>

</div>

</div>

</blockquote>

</div>

</div>

</div>

</body>

</html>