<div dir="ltr"><div dir="ltr"><div style="font-family:arial,sans-serif;font-size:12.800000190734863px">(Apologies for cross-posting)<br></div><div style="font-family:arial,sans-serif;font-size:12.800000190734863px"><font face="arial, helvetica, sans-serif"><br>
</font></div><div style="font-family:arial,sans-serif;font-size:12.800000190734863px"><font face="arial, helvetica, sans-serif"><span style="text-indent:32px;text-align:justify">We organize an international bakeoff on <b>Chinese Spelling Check</b> in </span><b>CLP-2014 (Oct. 20-21 in Wuhan, China)</b>, which is the 3rd conference jointly organized by the Chinese <span style="text-indent:32px;text-align:justify">Language Processing Society of China (<b>CIPS</b>) </span><span style="text-align:justify;text-indent:32px"><font color="#000000">and the ACL Special Interest Group on Chinese Language Processing (<b>SIGHAN)</b>. You are welcome to participate our task. </font></span></font></div>
<div style="font-family:arial,sans-serif;font-size:12.800000190734863px"><span style="text-indent:32px;text-align:justify"><font face="arial, helvetica, sans-serif"><br></font></span></div><div style="font-family:arial,sans-serif;font-size:12.800000190734863px">
<font face="arial, helvetica, sans-serif"><span style="text-indent:32px;text-align:justify">For more information, kindly visit  </span><font color="#000000"><a href="http://ir.itc.ntnu.edu.tw/clp2014/task2csc.html" target="_blank">http://ir.itc.ntnu.edu.tw/clp2014/task2csc.html</a></font></font></div>
<div style="font-family:arial,sans-serif;font-size:12.800000190734863px"><font face="arial, helvetica, sans-serif"><br></font></div><div style="font-family:arial,sans-serif;font-size:12.800000190734863px"><font face="arial, helvetica, sans-serif"><b><u>Introduction</u></b></font></div>
<div style="font-family:arial,sans-serif;font-size:12.800000190734863px"><font face="arial, helvetica, sans-serif"><span style="text-align:justify">The number of people learning Chinese as a Foreign Language (CFL) is booming in recent decades. This number is expected to become even larger for the years to come. However, unlike English learning environment where many learning techniques have been developed, tools to support CFL learners are relatively rare, especially those that could automatically detect and correct Chinese spelling and grammatical errors. For example, Microsoft Word has not yet supported these functions for Chinese, although it supports English for years. In this bakeoff, essays written by CFL learners were collected for developing automatic spelling checkers. The hope is that through such evaluation campaigns, more innovative computer-assisted techniques will emerge, more effective Chinese learning resources will be built, and the state-of-art NLP techniques will be advanced for the educational applications.</span><br>
</font></div><div style="font-family:arial,sans-serif;font-size:12.800000190734863px"><u><font face="arial, helvetica, sans-serif"><br></font></u></div><div style="font-family:arial,sans-serif;font-size:12.800000190734863px">
<font face="arial, helvetica, sans-serif"><u><b>Task Description</b></u><br></font></div><div style="font-family:arial,sans-serif;font-size:12.800000190734863px"><div align="justify"><font face="arial, helvetica, sans-serif">The goal of this task is to evaluate the capability of a Chinese spelling checker. The passage consisting of several sentences with/without spelling errors will be given as the input. The checker should return the locations of incorrect characters and suggest the correct characters. Each character or punctuation occupies one position for counting location. If the input contains no spelling errors, the system should return “<strong>pid, 0</strong>”. If the input contains at least one spelling errors, the output format is “<strong>pid [, location, correction]+</strong>”.</font></div>
</div><div align="justify" style="font-family:arial,sans-serif;font-size:12.800000190734863px"><span style="text-align:start"><font face="arial, helvetica, sans-serif"><u><br></u></font></span></div><div align="justify" style="font-family:arial,sans-serif;font-size:12.800000190734863px">
<span style="text-align:start"><font face="arial, helvetica, sans-serif"><b><u>Data Sets</u> </b></font></span></div><div align="justify" style="font-family:arial,sans-serif;font-size:12.800000190734863px"><font face="arial, helvetica, sans-serif"><span style="text-align:start">The policy of our evaluation is an open test. Participants can employ any linguistic and computational resources to develop your spelling checker. For example, the datasets with gold standard annotation for spelling check bakeoff last year can be freely downloaded at</span><span style="text-align:start"> </span><a href="http://ir.itc.ntnu.edu.tw/lre/sighan7csc.html" target="_blank" style="text-align:start">http://ir.itc.ntnu.edu.tw/lre/sighan7csc.html</a><span style="text-align:start"> </span><span style="text-align:start">for your reference. This year, we also provide passages of CFLs’ essays selected from the NTNU learner corpus for training purpose. The data will be released in SGML format shown as follows. In addition, at least 1000 testing passages selected to cover different complexities will be used for testing.</span></font></div>
<div align="justify" style="font-family:arial,sans-serif;font-size:12.800000190734863px"><u><font face="arial, helvetica, sans-serif"><br></font></u></div><div align="justify" style="font-family:arial,sans-serif;font-size:12.800000190734863px">
<font face="arial, helvetica, sans-serif"><u><b>Important Dates</b></u><br></font></div><div align="justify" style="font-family:arial,sans-serif;font-size:12.800000190734863px"><ul><li style="margin-left:15px"><font face="arial, helvetica, sans-serif">Registration for Bakeoffs open: <b>2014-03-20</b><br>
</font></li><li style="margin-left:15px"><font face="arial, helvetica, sans-serif">Training data released: <strong>2014-05-01</strong><br></font></li><li style="margin-left:15px"><font face="arial, helvetica, sans-serif">Dry run (format validation): <strong>2014-05-20</strong><br>
</font></li><li style="margin-left:15px"><font face="arial, helvetica, sans-serif">Registration for Bakeoffs close: <strong>2014-06-30</strong><br></font></li><li style="margin-left:15px"><font face="arial, helvetica, sans-serif">Test data released: <strong>2014-07-30 (18:00 Beijing Time)</strong><br>
</font></li><li style="margin-left:15px"><font face="arial, helvetica, sans-serif">Test result submission deadline: <strong>2014-08-01 (18:00 Beijing Time)</strong><br></font></li><li style="margin-left:15px"><font face="arial, helvetica, sans-serif">Test result evaluation released: <strong>2014-08-20</strong><br>
</font></li><li style="margin-left:15px"><font face="arial, helvetica, sans-serif">Evaluation report submission deadline: <strong>2014-08-26</strong><br></font></li><li style="margin-left:15px"><font face="arial, helvetica, sans-serif">Evaluation report reviews return: <strong>2014-09-01</strong><br>
</font></li><li style="margin-left:15px"><font face="arial, helvetica, sans-serif">Final evaluation report submission deadline: <strong>2014-09-10</strong><br></font></li><li style="margin-left:15px"><font face="arial, helvetica, sans-serif">Main Conference: <strong><a href="tel:2014-10-20%2F21" value="+12014102021" target="_blank">2014-10-20/21</a></strong><br>
</font></li></ul><div><font color="#000000" face="arial, helvetica, sans-serif"><br></font></div><div><font color="#000000" face="arial, helvetica, sans-serif">On behalf of co-organizers</font></div><div><font color="#000000" face="arial, helvetica, sans-serif">Liang-Chih Yu, Lung-Hao Lee, Yuen-Hsien Tseng, and Hsin-Hsi Chen</font></div>
</div></div>
</div>