<div style="text-align:center"><b>Call for Papers</b></div><div style="text-align:center"><b><a href="http://www.sigwac.org.uk/wiki/WAC6" target="_blank">6th Web as Corpus Workshop (WAC-6)</a></b></div><div style="text-align:center">


To be held in association with <a href="http://naaclhlt2010.isi.edu">NAACL-HLT</a> in Los Angeles, 5th/6th June 2010</div><div style="text-align:center">Sponsored by <a href="http://sigwac.org.uk">ACL SIGWAC</a></div><div style="text-align:center">

<br></div><div style="text-align:center"><b>Submissions due March 1st 2010</b></div>
<div><br></div><b>Invited speaker</b>: Patrick Pantel, ISI, University of Southern California<div><br><b>Description</b><br>More and more people are using Web data for linguistic and NLP research.  The workshop, the sixth in an annual series, provides a venue for exploring how we can use it effectively and what we will find if we do.<br>


 <br>We invite submissions which:<br><ul><li>describe Web corpus collection projects, or modules for one part of the process (crawling, filtering, de-duplication, language-id, tokenising, indexing, ...)</li><li>explore characteristics of Web data from a linguistics/NLP perspective including registers, domains, frequency distributions, comparisons between datasets</li>

<li>use crawled Web data for NLP purposes (with emphasis on the data rather than the use)</li></ul>Previous WAC workshops have been in Europe and Africa. The west coast of the US is the global centre for web development, hosting Google, Microsoft, Yahoo and a thousand others, so we are looking forward to visiting!<br>

<br></div><div><b>Dates</b><br><ul><li>Submission by March 1st 2010, to be made through the NAACL system at  <a href="https://www.softconf.com/naaclhlt2010/webascorpus/" target="_blank">https://www.softconf.com/naaclhlt2010/webascorpus/</a></li>

<li>Notification of acceptance by March 30</li><li>Camera-ready copy due April 12</li></ul>Submissions should be formatted using the NAACL 2010 stylefiles, with blind review and not exceeding 8 pages plus an extra page for references. The stylefiles are available at http://<a href="http://naaclhlt2010.isi.edu/authors.html" target="_blank">naaclhlt2010.isi.edu/authors.html</a>.  Each submission will be reviewed by at least two members of the programme committee. Accepted papers will be published in the workshop proceedings.<br>


<br><b>Organising committee</b><br><a href="mailto:adam@lexmasterclass.com">Adam Kilgarriff</a> (Lexical Computing Ltd., Workshop Chair)<br>Dekang Lin (Google Inc)<br>Serge Sharoff (University of Leeds, SIGWAC Chair)<br>

<br><b>Programme committee</b><br>Organising committee plus:<br><br>Silvia Bernardini, U of Bologna, Italy<br>Oren Etzioni, U Washington, USA<br>Stefan Evert, U of Osnabrück, Germany<br>Cédrick Fairon, UCLouvain, Belgium<br>

William H. Fletcher, U.S. Naval Academy, USA<br>Gregory Grefenstette, Exalead, France<br>Andras Kornai, Harvard University, USA<br>Igor Leturia, Elhuyar Fundazioa, Basque Country, Spain<br>Preslav Nakov, National U of Singapore<br>

Jan Pomikalek, Masaryk U, Brno, Czech Republic<br>Kevin Scannell, Saint Louis U, USA<br>Gilles-Maurice de Schryver, U Gent, Belgium<br>Eros Zanchetta, U of Bologna, Italy<br><br>--<br>================================================<br>

Adam Kilgarriff                                      <a href="http://www.kilgarriff.co.uk" target="_blank">http://www.kilgarriff.co.uk</a>              <br>
Lexical Computing Ltd                   <a href="http://www.sketchengine.co.uk" target="_blank">http://www.sketchengine.co.uk</a><br>Lexicography MasterClass Ltd      <a href="http://www.lexmasterclass.com" target="_blank">http://www.lexmasterclass.com</a><br>


Universities of Leeds and Sussex       <a href="mailto:adam@lexmasterclass.com" target="_blank">adam@lexmasterclass.com</a><br>================================================<br>
</div>