<div dir="ltr">Well, for one thing, our government isn't asking advice at this point -- they are issuing edicts.<br><br>For another thing, this is yet another reason that linguists should be proactively LOUD about the unsuitability for LLMs (for just about anything).<div><br></div><div>Emily</div><div><br></div></div><br><div class="gmail_quote gmail_quote_container"><div dir="ltr" class="gmail_attr">On Tue, Feb 4, 2025 at 8:23 AM Stela Manova via Lingtyp <<a href="mailto:lingtyp@listserv.linguistlist.org">lingtyp@listserv.linguistlist.org</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div class="msg-4111648901962495592">




<div dir="ltr">
<div style="font-family:Aptos,Aptos_EmbeddedFont,Aptos_MSFontService,Calibri,Helvetica,sans-serif;font-size:12pt;color:rgb(0,0,0)">
In my message, I do not advertise LLMs as true archives. I only point out that much data are stored somewhere already; of course, we do not know in what format and order. Then, I do not think that when your government decides which data should be preserved
 (or backed up), they will ask linguists, which thus again leads us to LLMs / computer scientists.</div>
<div style="font-family:Aptos,Aptos_EmbeddedFont,Aptos_MSFontService,Calibri,Helvetica,sans-serif;font-size:12pt;color:rgb(0,0,0)">
Stela</div>
<div id="m_-3866891103137281927Signature"></div>
<div id="m_-3866891103137281927appendonsend"></div>
<div style="font-family:Calibri,Arial,Helvetica,sans-serif;font-size:12pt;color:rgb(0,0,0)">
<br>
</div>
<hr style="display:inline-block;width:98%">
<span style="font-family:Calibri,Arial,Helvetica,sans-serif;font-size:12pt;color:rgb(0,0,0)"><b>From:</b> Lingtyp on behalf of William Croft via Lingtyp<br>
<b>Sent:</b> Tuesday, February 4, 2025 5:01 PM<br>
<b>To:</b> Juergen Bohnemeyer<br>
<b>Cc:</b> <a href="mailto:lingtyp@listserv.linguistlist.org" target="_blank">lingtyp@listserv.linguistlist.org</a><br>
<b>Subject:</b> Re: [Lingtyp] Concerns about U.S. policies and linguistic archives
</span>
<div style="font-family:Calibri,Arial,Helvetica,sans-serif;font-size:12pt;color:rgb(0,0,0)">
<br>
</div>
<div>I would add that if Musk/Trump are successful in their efforts (they aren’t stopped by the courts or the people), then red states such as Texas may follow their lead. Also, federal funding pervades government budgets at all levels (state, local etc.),
 as everyone here is about to discover. That gives the federal government leverage over state and local goverment activities and budget allocations.</div>
<div><br>
</div>
<div>Bill</div>
<div><br>
</div>
<blockquote>
<div>On Feb 4, 2025, at 7:33 AM, Juergen Bohnemeyer via Lingtyp <<a href="mailto:lingtyp@listserv.linguistlist.org" target="_blank">lingtyp@listserv.linguistlist.org</a>> wrote:</div>
<br>
<div style="text-align:left;text-indent:0px;margin:0in;font-family:"CMU Serif";font-size:12pt">
Dear Jocelyn – Indeed, we are once again finding ourselves in “interesting”, read unprecedented and disturbing, times. Now, I may not be in the best position to respond to your query, but any immediate concern for the safety of language archives would only
 relate to things that are under the control of the federal government, such as the Library of Congress or the National Endowment for the Humanities. And as far as I know, these have not been archiving data and records from endangered languages. </div>
<div style="text-align:left;text-indent:0px;margin:0in;font-family:"CMU Serif";font-size:12pt">
 </div>
<div style="text-align:left;text-indent:0px;margin:0in;font-family:"CMU Serif";font-size:12pt">
I do, however, worry about the Smithsonian Institution in this regard. Other than the Smithsonian, the language archive that comes immediately to mind, AILLA at UT, is not under the purview of the federal government. </div>
<div style="text-align:left;text-indent:0px;margin:0in;font-family:"CMU Serif";font-size:12pt">
 </div>
<div style="text-align:left;text-indent:0px;margin:0in;font-family:"CMU Serif";font-size:12pt">
In any event, beyond the current situation, it seems indeed vitally important to connect the world’s digital language archives and create a system of mirrors in order to effectively decentralize the data and thereby make it less vulnerable to threats on any
 one site or even country. It’s my understanding that the people in charge of the archives are well aware of this and have begun to take steps. But it’s a long-haul project, based on my very incomplete understanding.</div>
<div style="text-align:left;text-indent:0px;margin:0in;font-family:"CMU Serif";font-size:12pt">
 </div>
<div style="text-align:left;text-indent:0px;margin:0in;font-family:"CMU Serif";font-size:12pt">
Best – Juergen</div>
<div style="text-align:left;text-indent:0px;margin:0in;font-family:"CMU Serif";font-size:12pt">
 </div>
<div style="text-align:left;text-indent:0px;margin:0in;font-family:Aptos,sans-serif;font-size:12pt">
<span style="font-family:Helvetica;font-size:9pt">Juergen Bohnemeyer (He/Him)<br>
Professor, Department of Linguistics<br>
University at Buffalo <br>
<br>
Office: 642 Baldy Hall, UB North Campus<br>
Mailing address: 609 Baldy Hall, Buffalo, NY 14260 <br>
Phone: (716) 645 0127 <br>
Fax: (716) 645 3825<br>
Email: </span><span style="font-family:Helvetica;font-size:9pt;color:rgb(0,120,212)"><u><a href="mailto:jb77@buffalo.edu" id="m_-3866891103137281927OWA1bec983d-b7c3-73f5-b050-28e5a42a85b8" title="mailto:jb77@buffalo.edu" style="color:rgb(0,120,212)" target="_blank">jb77@buffalo.edu</a></u></span><span style="font-family:Helvetica;font-size:9pt"><br>
Web: </span><span style="font-family:Helvetica;font-size:9pt;color:rgb(5,99,193)"><u><a href="https://urldefense.com/v3/__http://www.acsu.buffalo.edu/*jb77/__;fg!!K-Hz7m0Vt54!lZlQBu-ZCcJBmwwcV31AfzXekzrXaQEwQaPqlmajisvNUOG3CMZIRvoOhlu6rT0G0NN9jTggHRp5r9LUgMC-b9YZs2JLRTe3-Q$" id="m_-3866891103137281927OWAa307a3d5-0877-49d9-86a8-cde067e0bf6f" title="http://www.acsu.buffalo.edu/~jb77/" style="color:rgb(5,99,193)" target="_blank">http://www.acsu.buffalo.edu/~jb77/</a></u></span><span style="font-family:Helvetica;font-size:9pt"> <br>
<br>
</span><span style="font-family:Calibri,sans-serif;font-size:11pt">Office hours Tu/Th 3:30-4:30pm in 642 Baldy or via Zoom (Meeting ID 585 520 2411; Passcode Hoorheh) </span><span style="font-family:Helvetica;font-size:9pt"><br>
<br>
There’s A Crack In Everything - That’s How The Light Gets In <br>
(Leonard Cohen)  </span></div>
<div style="text-align:left;text-indent:0px;margin:0in;font-family:Calibri,sans-serif;font-size:11pt">
-- </div>
<div style="text-align:left;text-indent:0px;margin:0in;font-family:"CMU Serif";font-size:12pt">
 </div>
<div style="text-align:left;text-indent:0px;margin:0in;font-family:"CMU Serif";font-size:12pt">
 </div>
<div id="m_-3866891103137281927x_mail-editor-reference-message-container">
<div style="padding:3pt 0in 0in;border-width:1pt medium medium;border-style:solid none none;border-color:rgb(181,196,223) currentcolor currentcolor">
<p style="margin:0in 0in 12pt 0.5in;font-family:Aptos,sans-serif;font-size:12pt">
<b>From: </b>Lingtyp <<span style="color:blue"><u><a href="mailto:lingtyp-bounces@listserv.linguistlist.org" id="m_-3866891103137281927OWA96e34f89-89d5-b1d1-ca3e-c7734f335be4" style="color:blue;margin-top:0px;margin-bottom:0px" target="_blank">lingtyp-bounces@listserv.linguistlist.org</a></u></span>>
 on behalf of Jocelyn Aznar via Lingtyp <<span style="color:blue"><u><a href="mailto:lingtyp@listserv.linguistlist.org" id="m_-3866891103137281927OWAe583cc01-d6ca-533b-a9ac-8b334b68775b" style="color:blue;margin-top:0px;margin-bottom:0px" target="_blank">lingtyp@listserv.linguistlist.org</a></u></span>><br>
<b>Date: </b>Tuesday, February 4, 2025 at 05:02<br>
<b>To: </b><span style="color:blue"><u><a href="mailto:lingtyp@listserv.linguistlist.org" id="m_-3866891103137281927OWAd5fdef83-09fb-3b65-1a56-dceb867a3e4a" style="color:blue;margin-top:0px;margin-bottom:0px" target="_blank">lingtyp@listserv.linguistlist.org</a></u></span> <<span style="color:blue"><u><a href="mailto:lingtyp@listserv.linguistlist.org" id="m_-3866891103137281927OWA2fdd2d49-f155-a932-4824-4b589111be2d" style="color:blue;margin-top:0px;margin-bottom:0px" target="_blank">lingtyp@listserv.linguistlist.org</a></u></span>><br>
<b>Subject: </b>[Lingtyp] Concerns about U.S. policies and linguistic archives</p>
</div>
<div style="margin:0in 0in 0in 0.5in;font-family:Aptos,sans-serif;font-size:11pt">
Dear colleagues,<br>
<br>
I know this list is primarily meant for discussing ideas and <br>
observations related to linguistic typology, rather than politics. <br>
However, current U.S. policies regarding scientific data have led me to <br>
wonder whether these policies might affect the fields of linguistics and <br>
humanities.<br>
<br>
When I heard about data related to ecology and the environment being <br>
discarded, I immediately worried the same could happen to linguistic <br>
archives and datasets. But maybe it is just me, dear colleagues working <br>
in the US, what do you think? Could this happen as well to archives <br>
related to linguistics and humanities?<br>
<br>
I believe that if we address this issue proactively, we’ll be better <br>
placed to preserve more data should the need arise. For instance, we <br>
could check whether the existing infrastructure outside of the US, ELAR, <br>
HumaNum/Ortolang, Pangloss, Paradisec, etc, would be able to handle or <br>
help to face such a crisis? or whether we should consider setting up <br>
some sort of emergency server so that researchers can transfer data at <br>
risk of being lost?<br>
<br>
One possible strategy would be to prepare a brief manual (probably as a <br>
webpage), after discussing with each institution of course, describing <br>
which archives outside the U.S. could accept data from an archive from <br>
the US, in which format, what kind of data would be accepted, etc. Then, <br>
if needed, U.S based researchers could formulate a plan to safeguard <br>
their data. By doing that, we could also identify gaps in current <br>
coverage and, if necessary, establish an emergency archive or server to <br>
fill those gaps.<br>
<br>
Best regards,<br>
Jocelyn Aznar<br>
<br>
¹ I’m of course also concerned about data from other fields, though I <br>
feel more competent discussing linguistic data. Still, if we build an <br>
infrastructure for linguistic data from the U.S., it might be possible <br>
to scale it up for other disciplines as well.<br>
_______________________________________________<br>
Lingtyp mailing list<br>
<span style="color:blue"><u><a href="mailto:Lingtyp@listserv.linguistlist.org" id="m_-3866891103137281927OWA351e76ad-acdf-e2bb-2fb3-39ba21e76c41" style="color:blue" target="_blank">Lingtyp@listserv.linguistlist.org</a></u></span><br>
<span style="color:blue"><u><a href="https://urldefense.com/v3/__https://listserv.linguistlist.org/cgi-bin/mailman/listinfo/lingtyp__;!!K-Hz7m0Vt54!lZlQBu-ZCcJBmwwcV31AfzXekzrXaQEwQaPqlmajisvNUOG3CMZIRvoOhlu6rT0G0NN9jTggHRp5r9LUgMC-b9YZs2KKINT-RA$" id="m_-3866891103137281927OWA36ba7adb-094e-3487-dacd-5629d85bb285" style="color:blue" target="_blank">https://nam12.safelinks.protection.outlook.com/?url=https%3A%2F%2Flistserv.linguistlist.org%2Fcgi-bin%2Fmailman%2Flistinfo%2Flingtyp&data=05%7C02%7Cjb77%40buffalo.edu%7C8ad63c8d02e04bd681a208dd4502fde3%7C96464a8af8ed40b199e25f6b50a20250%7C0%7C0%7C638742601354965905%7CUnknown%7CTWFpbGZsb3d8eyJFbXB0eU1hcGkiOnRydWUsIlYiOiIwLjAuMDAwMCIsIlAiOiJXaW4zMiIsIkFOIjoiTWFpbCIsIldUIjoyfQ%3D%3D%7C0%7C%7C%7C&sdata=DJ%2Fl9ABlxi%2BjR%2B8C9PDqzDpGS5vkWcUnOZy6OWubBuI%3D&reserved=0</a></u></span></div>
</div>
<span style="font-family:Helvetica;font-size:14px">_______________________________________________</span><br>
<span style="font-family:Helvetica;font-size:14px">Lingtyp mailing list</span><br>
<span style="font-family:Helvetica;font-size:14px;color:blue"><u><a href="mailto:Lingtyp@listserv.linguistlist.org" id="m_-3866891103137281927OWAc45e0412-d381-192a-2de5-1716e7ac6e7d" style="color:blue;text-align:left" target="_blank">Lingtyp@listserv.linguistlist.org</a></u></span><br>
<span style="font-family:Helvetica;font-size:14px;color:blue"><u><a href="https://urldefense.com/v3/__https://listserv.linguistlist.org/cgi-bin/mailman/listinfo/lingtyp__;!!K-Hz7m0Vt54!lZlQBu-ZCcJBmwwcV31AfzXekzrXaQEwQaPqlmajisvNUOG3CMZIRvoOhlu6rT0G0NN9jTggHRp5r9LUgMC-b9YZs2KKINT-RA$" id="m_-3866891103137281927OWAd8983322-5040-5af4-1b03-33bfbb4444c8" style="color:blue;text-align:left" target="_blank">https://listserv.linguistlist.org/cgi-bin/mailman/listinfo/lingtyp</a></u></span><br>
</blockquote>
<br>
</div>

_______________________________________________<br>
Lingtyp mailing list<br>
<a href="mailto:Lingtyp@listserv.linguistlist.org" target="_blank">Lingtyp@listserv.linguistlist.org</a><br>
<a href="https://urldefense.com/v3/__https://listserv.linguistlist.org/cgi-bin/mailman/listinfo/lingtyp__;!!K-Hz7m0Vt54!lZlQBu-ZCcJBmwwcV31AfzXekzrXaQEwQaPqlmajisvNUOG3CMZIRvoOhlu6rT0G0NN9jTggHRp5r9LUgMC-b9YZs2KKINT-RA$" rel="noreferrer" target="_blank">https://urldefense.com/v3/__https://listserv.linguistlist.org/cgi-bin/mailman/listinfo/lingtyp__;!!K-Hz7m0Vt54!lZlQBu-ZCcJBmwwcV31AfzXekzrXaQEwQaPqlmajisvNUOG3CMZIRvoOhlu6rT0G0NN9jTggHRp5r9LUgMC-b9YZs2KKINT-RA$</a> <br>
</div></blockquote></div>