<div>We are pleased to announce that a preview version of the Icelandic Parsed Historical Corpus (IcePaHC) is now available for free download. The corpus is syntactically parsed, annotated for full phrase structure using an adaptation of the annotation scheme used by the Penn parsed corpora of historical English (<a href="http://www.ling.upenn.edu/hist-corpora/">http://www.ling.upenn.edu/hist-corpora/</a>) and other corpora in that tradition (see links from website). The preview contains ca. 31.000 words from two periods, the 12th century and the 19th century. Please note that this is a small portion of the ultimate goal for the completed corpus, ca. 1 million words from the 12th-19th centuries.</div>
<div><br></div><div>The corpus is distributed as raw UTF-8 data in labeled bracketing format and it is therefore compatible with various existing programs, including CorpusSearch (<a href="http://corpussearch.sourceforge.net/">http://corpussearch.sourceforge.net/</a>).</div>
<div><br></div><div>The corpus can be downloaded from:</div><div><a href="http://www.linguist.is/wiki/Download">www.linguist.is/wiki/Download</a></div><div><br></div><div>Further information on the annotation guidelines and project organization can be found on the project wiki:</div>
<div><a href="http://www.linguist.is/wiki/">www.linguist.is/wiki/</a></div><div><br></div><div>We hope that this early release will result in feedback that allows us to improve the resource for upcoming versions. Updates will be released every three months for the next 12 months - starting with version 0.2 which will be released on October 1st 2010. Between releases, development can be tracked at our open repository at Github (<a href="http://github.com/antonkarl/icecorpus">http://github.com/antonkarl/icecorpus</a>) but use of released versions is encouraged to ensure that results can be replicated.</div>
<div><br></div><div>Joel Wallenberg (<a href="mailto:joel.wallenberg@gmail.com">joel.wallenberg@gmail.com</a>)</div><div>Anton Karl Ingason (<a href="mailto:anton.karl.ingason@gmail.com">anton.karl.ingason@gmail.com</a>)</div>
<div>Einar Freyr Sigurđsson (<a href="mailto:einarfs@gmail.com">einarfs@gmail.com</a>)</div><div>Eiríkur Rögnvaldsson (<a href="mailto:eirikur@hi.is">eirikur@hi.is</a>)</div><div>University of Iceland</div><div><br></div>
<div>The project is funded by the following grants:</div><div><br></div><div>Icelandic Research Fund (RANNÍS), grant nr. 090662011,"Viable Language Technology beyond English – Icelandic as a test case".</div><div>
<br></div><div>U.S. National Science Foundation (NSF) International Research Fellowship Program (IRFP), grant #OISE-0853114, "Evolution of Language Systems: a comparative study of grammatical change in Icelandic and English".</div>