<div dir="ltr">Dear colleagues,<div><br></div><div>I'd like to present several corpora of Uralic languages of the Volga-Kama area I've been working on for the last two years. The main start page is located here: <a href="http://volgakama.web-corpora.net/index_en.html">http://volgakama.web-corpora.net/index_en.html</a>. Here are the pages for the individual languages:</div><div><br></div><div>Udmurt: <a href="http://udmurt.web-corpora.net/" target="_blank">http://udmurt.web-corpora.net/index_en.html</a></div><div>Komi-Zyrian: <a href="http://komi-zyrian.web-corpora.net/" target="_blank">http://komi-zyrian.web-corpora.net/index_en.html</a></div><div>Erzya: <a href="http://erzya.web-corpora.net/" target="_blank">http://erzya.web-corpora.net/index_en.html</a></div><div>Moksha: <a href="http://moksha.web-corpora.net/" target="_blank">http://moksha.web-corpora.net/index_en.html</a></div><div>Meadow Mari: <a href="http://meadow-mari.web-corpora.net/" target="_blank">http://meadow-mari.web-corpora.net/index_en.html</a></div><div><br></div><div>For each language, there is a Social media corpus and a "Main" corpus that includes everything else (mostly news outlets). All corpora have been morphologically analyzed with rule-based analyzers; in most cases, there was no subsequent disambiguation. The search interface is available in English and in Russian; the lemmata have Russian translations. The corpora vary in size from 14 thousand to 9,5 million words. Apart from that, the social media corpora also contain Russian text in much larger quantities.</div><div><br></div><div>Regarding Meadow Mari corpora: later this year, we are going to join forces with Jeremy Bradley and his colleagues, who have been working on much larger and better annotated literary Mari corpora for some time (cf. <a href="http://corpus.mari-language.com/" rel="noreferrer" target="_blank">corpus.mari-language.com</a>).</div><div><br></div><div>Please do not hesitate to send me your questions and comments, I will be happy to answer them.</div><div><br></div><div>Best regards,</div><div>Timofey Arkhangelskiy</div></div>