<div dir="ltr"><span style="font-size:12.8px">Hi Joe and RNLD,</span><div style="font-size:12.8px"><br></div><div style="font-size:12.8px">Jorge is right, our paper on methods and data citation in grammars just came out in LD&C. That paper is part of a larger initiative on encouraging data citation and attribution more widely in linguistics, in which some 40+ linguists and data scientists have participated (<a href="https://protect-au.mimecast.com/s/aYDABqTVN7mEcv?domain=sites.google.com" target="_blank">our website</a>, which contains materials from three workshops held since 2015, and a session at the LSA in January). </div><div style="font-size:12.8px"><br></div><div style="font-size:12.8px">Other products of this project include a survey of 270 journal articles from 9 journals across the field, and a general position paper on data citation in linguistics. Unfortunately, the uptake on these last two items has been difficult so far and we have not yet found a venue willing to publish them -- it seems that documentary linguists are way ahead of the rest of the field in terms of wanting to "speak to the authenticity of the data", as you say. </div><div style="font-size:12.8px"><br></div><div style="font-size:12.8px">In short, we found that we linguist-authors are very good at citing data that comes from a traditional paper publication, but fairly lousy at citing data from any other source, or even describing how the data was obtained, whether through elicitation, or introspection, or narratives, etc. Our hunch is that there are multiple reasons for this, including:</div><div style="font-size:12.8px"><br></div><div style="font-size:12.8px">-lack of standards of <i>how</i> to format citations of data</div><div style="font-size:12.8px">-lack of policies by journals and other publishers on data</div><div style="font-size:12.8px">-lack of knowledge about <i>how,</i> <i>if</i> or <i>where</i> to store data, and when it's appropriate/ethical or inappropriate/unethical to <i>share</i> data</div><div style="font-size:12.8px">-uneasiness about accountability</div><div style="font-size:12.8px">-a general de-valuing of all of the work that goes into properly caring for data in hiring, tenure and promotion, such that analysis is prioritized over data work</div><div style="font-size:12.8px"><br>Again, the documentation community, and probably some areas of computational linguistics, seem to be at the forefront of encouraging and establishing practices for making linguistics more reproducible, but sociological change is slow and there's a clear need for education. By the way, we've also formed a group in the Research Data Alliance called the <a href="https://protect-au.mimecast.com/s/2mpEBkUAbgwRca?domain=rd-alliance.org" target="_blank">Linguistics Data Interest Group</a> that is open for anyone to join and contribute to the discussion.</div><div class="gmail_extra"><br clear="all"><div><div class="gmail_signature" data-smartmail="gmail_signature"><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr">Andrea<br style="font-size:12.8px"><span style="font-size:12.8px">--</span><br style="font-size:12.8px"><span style="font-size:12.8px">Andrea L. Berez-Kroeker</span><br style="font-size:12.8px"><div style="font-size:12.8px"><font size="1">Associate Professor and Chair of Graduate Studies</font></div><div style="font-size:12.8px"><font size="1">Department of Linguistics, </font><font size="1">University of Hawai'i at Mānoa</font></div><div style="font-size:12.8px"><font size="1">Director, Kaipuleohone UH Digital Language Archive</font></div><div style="font-size:12.8px"><font size="1">Senior co-Chair, LSA Committee for Endangered Languages and Their Preservation</font></div><div style="font-size:12.8px"><font size="1"><a href="https://protect-au.mimecast.com/s/6eKvBwHVrdNecr?domain=orcid.org" target="_blank">orcid.org/0000-0001-8782-515X</a> </font></div><div style="font-size:12.8px"><font size="1"><font color="#000000"><a href="https://protect-au.mimecast.com/s/NX1kBGS4k35QsK?domain=www2.hawaii.edu" target="_blank">http://www2.hawaii.edu/~aberez</a></font></font></div><div style="font-size:12.8px"><br><span style="font-size:x-small">Office hour appointments: </span><a style="font-size:x-small" href="https://protect-au.mimecast.com/s/bZ83B4ikmzE9tk?domain=bit.ly" target="_blank">http://bit.ly/uhlinggradchair</a><font size="1"><br></font></div></div></div></div></div></div></div></div></div></div></div></div></div></div></div></div></div>
<br><div class="gmail_quote">On Thu, Jun 8, 2017 at 3:42 AM, Jorge Emilio Rosés Labrada <span dir="ltr"><<a href="mailto:jrosesla@uwo.ca" target="_blank">jrosesla@uwo.ca</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr"><div><div><div><div>Dear Joe,<br><br></div>There's a new paper out (as of a couple of days ago) in <i>Language Documentation & Conservation </i>by Lauren Gawne, Barbara F. Kelly, Andrea L. Berez-Kroeker & Tyler Heston that examines this issue:<i> </i><a href="https://protect-au.mimecast.com/s/Jb1zBJSwAEzGt6?domain=scholarspace.manoa.hawaii.edu" target="_blank">Putting practice into words: The state of data and methods transparency in grammatical descriptions</a><br><br></div>Lauren, Andrea, Barbara and Tyler will be able to say more about this than I can but my understanding is that there is definitely a move in the direction of including this type of data with examples in newer work. <br><br></div>Best,<br></div>Jorge<br></div><div class="gmail_extra"><br clear="all"><div><div class="m_-1329784338334607801gmail_signature" data-smartmail="gmail_signature"><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div>____________<span class="HOEnZb"><font color="#888888"><br>Jorge Emilio Rosés Labrada<br><span>Banting-Killam Postdoctoral Fellow<br></span></font></span></div><span class="HOEnZb"><font color="#888888"><div><span>First Nations and Endangered Languages Program<br></span></div><div><span>University of British Columbia<br></span></div></font></span></div></div></div></div></div></div></div></div></div><div><div class="h5">
<br><div class="gmail_quote">On Thu, Jun 8, 2017 at 6:44 AM, Brenda Boerger <span dir="ltr"><<a href="mailto:brenda_boerger@sil.org" target="_blank">brenda_boerger@sil.org</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div link="blue" vlink="purple" lang="EN-US"><div class="m_-1329784338334607801m_-8847232027530883911WordSection1"><p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1f497d">Hi Joe, </span></p><p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1f497d"> </span></p><p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1f497d">Yes, it is or should be best practice to include the source of any data we use in our papers. </span></p><p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1f497d"> </span></p><p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1f497d">For some of my work on Natqgu [ntu] I no longer have the recordings of 30+ years ago, but only the transcribed text. In these instances I cite the text number and line number for the examples, even though the examples are also numbered sequentially in the paper. That makes for lots of numbers running around. </span></p><p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1f497d"> </span></p><p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1f497d">The ideal is that every file is named uniquely and prepared for archiving so that someone 50 years in the future can find your corpus and the recordings you cited based on what you put in your paper. </span></p><p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1f497d"> </span></p><p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1f497d">I don’t think we’re there yet. I have not archived what I’m working on. And I’m guessing that this will be a cyclic process—collect and name, analyze and write, archive SOMETHING, repeat process. </span></p><p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1f497d"> </span></p><p class="m_-1329784338334607801m_-8847232027530883911DELBIBLIO"><span style="font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1f497d">I’m not aware of particular references stipulating this and will be interested to hear what others have to say. I’m thinking we need to add this to our e-book: <br></span>Boerger, Brenda H., Stephen N. Self, Sarah Ruth Moeller, and D. Will Reiman. 2016.  <span class="m_-1329784338334607801m_-8847232027530883911MsoBookTitle">Language and Culture Documentation Manual</span>. LeanPub. <br><a href="https://protect-au.mimecast.com/s/Xq1aBmfmoeQVi5?domain=leanpub.com" target="_blank">https://leanpub.com/languagean<wbr>dculturedocumentationmanual</a> </p><p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1f497d">That would at least give you (and others) something to cite as best practice. Thanks for bringing this up. </span></p><p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1f497d"> </span></p><p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1f497d">~Brenda</span></p><div><p class="MsoNormal" style="margin-left:.2in;text-align:justify"><span style="color:#1f497d">______________________________<wbr>_</span></p><p class="MsoNormal" style="margin-left:.2in;text-align:justify"><span style="color:#1f497d">Brenda H. Boerger, PhD </span></p><p class="MsoNormal" style="margin-left:.2in;text-align:justify"><span style="color:#1f497d">Special Consultant for Language and Culture Documentation</span></p><p class="MsoNormal" style="margin-left:.2in;text-align:justify"><span style="color:#1f497d">SIL International Language Program Services </span></p><p class="MsoNormal" style="margin-left:.2in;text-align:justify"><span style="color:#1f497d"> </span></p><p class="MsoNormal" style="margin-left:.2in;text-align:justify"><span style="color:#1f497d"><a href="tel:(972)%20273-9356" value="+19722739356" target="_blank">972-273-9356</a> </span></p><p class="MsoNormal" style="margin-left:.2in;text-align:justify"><span style="color:#1f497d"><a href="https://protect-au.mimecast.com/s/78e1BkSRwNVnHV?domain=sil.org" target="_blank"><span style="color:blue">http://www.sil.org/biography/b<wbr>renda-h-boerger-phd</span></a></span></p><p class="MsoNormal" style="margin-left:.2in;text-align:justify"><span style="color:#1f497d"><a href="https://protect-au.mimecast.com/s/EM1xBvSWmqxpcr?domain=gial.edu" target="_blank"><span style="color:blue">http://www.gial.edu/faculty/br<wbr>enda-boerger/</span></a></span></p><p class="MsoNormal" style="margin-left:.2in;text-align:justify"><span style="color:#1f497d">Skype ID:  brenda_boerger1</span></p></div><p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1f497d"> </span></p><div><div style="border:none;border-top:solid #b5c4df 1.0pt;padding:3.0pt 0in 0in 0in"><p class="MsoNormal"><b><span style="font-size:10.0pt;font-family:"Tahoma","sans-serif"">From:</span></b><span style="font-size:10.0pt;font-family:"Tahoma","sans-serif""> Joe Blythe [mailto:<a href="mailto:joe.blythe@mq.edu.au" target="_blank">joe.blythe@mq.edu.au</a>] <br><b>Sent:</b> Thursday, June 08, 2017 2:02 AM<br><b>To:</b> r-n-l-d<br><b>Subject:</b> [RNLD] Best practice wrt authentic data</span></p></div></div><div><div class="m_-1329784338334607801h5"><p class="MsoNormal"> </p><div><div><div><p class="MsoNormal">Dear RNLDers</p></div><div><p class="MsoNormal"> </p></div><div><p class="MsoNormal">In just about every linguistics paper I’ve written, I’ve always mentioned which recording an example comes from (with a recording reference and time-codes), or which field notebook an example comes from, if elicited. I always thought that this practise speaks to the authenticity of the data. I assumed that if such a trail is trackable then you are unlikely to be accused of making stuff up!  </p></div><div><p class="MsoNormal">I know that there are many other researchers that do this, so I’m wondering there are references to this being best practice, or at least being advisable.</p></div><div><p class="MsoNormal"> </p></div><div><p class="MsoNormal">Also, turning this around, is it reasonable to expect (in 2017) that researchers writing about an endangered language follow such a protocol, if is in fact a protocol?</p></div><div><p class="MsoNormal"> </p></div><div><p class="MsoNormal">Best</p></div><div><p class="MsoNormal">Joe</p></div><div><p class="MsoNormal"> </p></div><div><div><div><div><div><p class="MsoNormal"><span style="font-size:8.5pt;font-family:"Calibri","sans-serif";color:black">Dr Joe Blythe</span><span style="color:black"></span></p></div><div><div><p class="MsoNormal"><span style="font-size:8.5pt;font-family:"Calibri","sans-serif";color:black">Department of Linguistics</span><span style="font-family:"Calibri","sans-serif";color:black"></span></p></div><div><p class="MsoNormal"><span style="font-size:8.5pt;font-family:"Calibri","sans-serif";color:black">Macquarie University</span><span style="font-family:"Calibri","sans-serif";color:black"></span></p></div><div><p class="MsoNormal"><span style="font-size:8.5pt;font-family:"Calibri","sans-serif";color:black">Room 566, Building C5A</span><span style="font-family:"Calibri","sans-serif";color:black"></span></p></div><div><p class="MsoNormal"><span style="font-size:8.5pt;font-family:"Calibri","sans-serif";color:black">Balaclava Rd, North Ryde, NSW 2109, Australia</span><span style="font-family:"Calibri","sans-serif";color:black"></span></p></div><div><p class="MsoNormal"><b><span style="font-size:8.5pt;font-family:"Calibri","sans-serif";color:black">Ph</span></b><span style="font-size:8.5pt;font-family:"Calibri","sans-serif";color:black">: <a href="tel:+61%202%209850%208089" value="+61298508089" target="_blank">+61-2-9850-8089</a>  |   <b>Mob</b>: +61-409-88-1153</span><span style="font-family:"Calibri","sans-serif";color:black"></span></p></div><div><p class="MsoNormal"><b><span style="font-size:8.5pt;font-family:"Calibri","sans-serif";color:black">E</span></b><span style="font-size:8.5pt;font-family:"Calibri","sans-serif";color:black">: <a href="mailto:joe.blythe@mq.edu.au" target="_blank">joe.blythe@mq.edu.au</a>  |  </span><span style="font-family:"Calibri","sans-serif";color:black"><a href="https://protect-au.mimecast.com/s/Rv1YBmtp2N3Qtv?domain=mq.edu.au" target="_blank"><b><span style="font-size:8.5pt">Web</span></b></a></span></p></div></div></div></div></div></div><p class="MsoNormal"> </p></div></div></div></div></div></div>
</blockquote></div><br></div></div></div>
</blockquote></div><br></div></div>