<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
<meta name="Generator" content="Microsoft Word 14 (filtered medium)">
<style><!--
/* Font Definitions */
@font-face
        {font-family:Calibri;
        panose-1:2 15 5 2 2 2 4 3 2 4;}
/* Style Definitions */
p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0cm;
        margin-bottom:.0001pt;
        font-size:11.0pt;
        font-family:"Calibri","sans-serif";
        mso-fareast-language:EN-US;}
a:link, span.MsoHyperlink
        {mso-style-priority:99;
        color:blue;
        text-decoration:underline;}
a:visited, span.MsoHyperlinkFollowed
        {mso-style-priority:99;
        color:purple;
        text-decoration:underline;}
p.MsoPlainText, li.MsoPlainText, div.MsoPlainText
        {mso-style-priority:99;
        mso-style-link:"Plain Text Char";
        margin:0cm;
        margin-bottom:.0001pt;
        font-size:11.0pt;
        font-family:"Calibri","sans-serif";
        mso-fareast-language:EN-US;}
span.EmailStyle17
        {mso-style-type:personal-compose;
        font-family:"Calibri","sans-serif";
        color:windowtext;}
span.PlainTextChar
        {mso-style-name:"Plain Text Char";
        mso-style-priority:99;
        mso-style-link:"Plain Text";
        font-family:"Calibri","sans-serif";}
.MsoChpDefault
        {mso-style-type:export-only;
        font-family:"Calibri","sans-serif";
        mso-fareast-language:EN-US;}
@page WordSection1
        {size:612.0pt 792.0pt;
        margin:72.0pt 72.0pt 72.0pt 72.0pt;}
div.WordSection1
        {page:WordSection1;}
--></style><!--[if gte mso 9]><xml>
<o:shapedefaults v:ext="edit" spidmax="1026" />
</xml><![endif]--><!--[if gte mso 9]><xml>
<o:shapelayout v:ext="edit">
<o:idmap v:ext="edit" data="1" />
</o:shapelayout></xml><![endif]-->
</head>
<body lang="EN-GB" link="blue" vlink="purple">
<div class="WordSection1">
<p class="MsoPlainText">8th Web as Corpus Workshop (WAC-8) @ Corpus Linguistics 2013<o:p></o:p></p>
<p class="MsoPlainText"><o:p></o:p></p>
<p class="MsoPlainText">Monday, 22 July 2013 (Lancaster, UK)<o:p></o:p></p>
<p class="MsoPlainText"><o:p></o:p></p>
<p class="MsoPlainText">    <a href="http://sigwac.org.uk/wiki/WAC8">http://sigwac.org.uk/wiki/WAC8</a><o:p></o:p></p>
<p class="MsoPlainText"><o:p></o:p></p>
<p class="MsoPlainText">Endorsed by ​ACL SIGWAC.<o:p></o:p></p>
<p class="MsoPlainText"><o:p> </o:p></p>
<p class="MsoPlainText">*** deadline extended slightly on request from Sunday 3rd to Thursday 7th ***<o:p></o:p></p>
<p class="MsoPlainText"><o:p></o:p></p>
<p class="MsoPlainText">Web corpora and other Web-derived data have become a gold mine for corpus linguistics and natural language processing. The Web is an easy source of unprecedented amounts of linguistic data from a broad range of registers and text types.
 However, a collection of Web pages is not immediately suitable for exploration in the same way a traditional corpus is.<o:p></o:p></p>
<p class="MsoPlainText"><o:p></o:p></p>
<p class="MsoPlainText">Since the first Web as Corpus Workshop organised at the Corpus Linguistics 2005 Conference, a highly successful series of yearly Web as Corpus workshops provides a venue for interested researchers to meet, share ideas and discuss the
 problems and possibilities of compiling and using Web corpora. After a stronger focus on application-oriented natural language processing and Web technology in recent years – with workshops taking place at NAACL-HLT 2010, 2011 and WWW 2012 – the 8th Web as
 Corpus Workshop returns to its roots in the corpus linguistics community.<o:p></o:p></p>
<p class="MsoPlainText"><o:p></o:p></p>
<p class="MsoPlainText">Accordingly, the leading theme of this workshop is the application of Web data in language research, including linguistic evaluation of Web-derived corpora as well as strategies and tools for high-quality automatic annotation of Web
 text. We invite papers on all aspects of building and using Web corpora, with a particular focus on (but not limited to) the following:<o:p></o:p></p>
<p class="MsoPlainText"><o:p></o:p></p>
<p class="MsoPlainText">* applications of Web corpora and other Web-derived data sets for language research<o:p></o:p></p>
<p class="MsoPlainText">* automatic linguistic annotation of Web data such as tokenisation, part-of-speech tagging, lemmatisation and semantic tagging (the accuracy of currently available off-the-shelf tools is still unsatisfactory for many types of Web data)<o:p></o:p></p>
<p class="MsoPlainText">* critical exploration of the characteristics of Web data from a linguistic perspective and its applicability to language research<o:p></o:p></p>
<p class="MsoPlainText">* presentation of Web corpus collection projects or software tools required for some part of this process (crawling, filtering, de-duplication, language identification, indexing, ...)<o:p></o:p></p>
<p class="MsoPlainText"><o:p></o:p></p>
<p class="MsoPlainText">Important dates<o:p></o:p></p>
<p class="MsoPlainText"><o:p></o:p></p>
<p class="MsoPlainText">March 7: Submission of extended abstract to be made through EasyChair <<a href="https://www.easychair.org/conferences/?conf=wac8">https://www.easychair.org/conferences/?conf=wac8</a>><o:p></o:p></p>
<p class="MsoPlainText">March 17: Notification of acceptance<o:p></o:p></p>
<p class="MsoPlainText">June 23: Submission of full paper<o:p></o:p></p>
<p class="MsoPlainText">July 22: Workshop<o:p></o:p></p>
<p class="MsoPlainText"><o:p></o:p></p>
<p class="MsoPlainText">Submission Information<o:p></o:p></p>
<p class="MsoPlainText"><o:p></o:p></p>
<p class="MsoPlainText">Authors are invited to submit extended abstracts on original, unpublished work in the topic area of this workshop. Contributions must be submitted in PDF format and should not exceed two (2) pages, including references. Submissions should
 be formatted using the format of ​the ACL 2013 proceedings.<o:p></o:p></p>
<p class="MsoPlainText"><o:p></o:p></p>
<p class="MsoPlainText">Authors of those papers that are accepted will be invited to submit full papers (up to eight pages) before the workshop itself and these will appear in an online proceedings.<o:p></o:p></p>
<p class="MsoPlainText"><o:p></o:p></p>
<p class="MsoPlainText">Organising committee<o:p></o:p></p>
<p class="MsoPlainText"><o:p></o:p></p>
<p class="MsoPlainText">Stefan Evert, Friedrich-Alexander-Universität Erlangen-Nürnberg (FAU)<o:p></o:p></p>
<p class="MsoPlainText">Egon Stemle, European Academy of Bozen/Bolzano (EURAC)<o:p></o:p></p>
<p class="MsoPlainText">Paul Rayson, Lancaster University<o:p></o:p></p>
<p class="MsoPlainText"><o:p> </o:p></p>
<p class="MsoPlainText">Programme committee<o:p></o:p></p>
<p class="MsoPlainText"><o:p> </o:p></p>
<p class="MsoPlainText">Silvia Bernardini, U of Bologna, Italy<o:p></o:p></p>
<p class="MsoPlainText">Paul Cook, U of Melbourne, Australia<o:p></o:p></p>
<p class="MsoPlainText">Cédrick Fairon, UCLouvain, Belgium<o:p></o:p></p>
<p class="MsoPlainText">William H. Fletcher, U.S. Naval Academy, USA<o:p></o:p></p>
<p class="MsoPlainText">Sebastian Hoffmann, U Trier, Germany<o:p></o:p></p>
<p class="MsoPlainText">Adam Kilgarriff. Lexical Computing Ltd, UK<o:p></o:p></p>
<p class="MsoPlainText">Preslav Nakov, QCRI, Qatar Foundation<o:p></o:p></p>
<p class="MsoPlainText">Reinhard Rapp, U Aix-Marseille, France & U Mainz, Germany<o:p></o:p></p>
<p class="MsoPlainText">Serge Sharoff, U of Leeds, UK<o:p></o:p></p>
<p class="MsoPlainText">Stephen Wattam, Lancaster U, UK<o:p></o:p></p>
<p class="MsoPlainText">Eros Zanchetta, U of Bologna, Italy<o:p></o:p></p>
<p class="MsoPlainText">Pierre Zweigenbaum, LIMSI, France<o:p></o:p></p>
<p class="MsoPlainText">+ members of the organising committee<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal"><span lang="EN-US" style="mso-fareast-language:EN-GB">Dr. Paul Rayson<o:p></o:p></span></p>
<p class="MsoNormal"><span lang="EN-US" style="mso-fareast-language:EN-GB">Director of UCREL and Senior Lecturer in Computer Science
<o:p></o:p></span></p>
<p class="MsoNormal"><span lang="EN-US" style="mso-fareast-language:EN-GB">Faculty of Science and Technology Director of International Teaching Partnerships<o:p></o:p></span></p>
<p class="MsoNormal"><span lang="EN-US" style="mso-fareast-language:EN-GB">School of Computing and Communications, Infolab21, Lancaster University, Lancaster, LA1 4WA, UK.<o:p></o:p></span></p>
<p class="MsoNormal"><span lang="EN-US" style="mso-fareast-language:EN-GB">Web: <a href="http://www.comp.lancs.ac.uk/~paul/">
<span style="color:windowtext;text-decoration:none">http://www.comp.lancs.ac.uk/~paul/</span></a><o:p></o:p></span></p>
<p class="MsoNormal"><span lang="EN-US" style="mso-fareast-language:EN-GB">Tel: +44 1524 510357 Fax: +44 1524 510492<o:p></o:p></span></p>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
</body>
</html>