<html xmlns:v="urn:schemas-microsoft-com:vml" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:st1="urn:schemas-microsoft-com:office:smarttags" xmlns="http://www.w3.org/TR/REC-html40">

<head>
<meta http-equiv=Content-Type content="text/html; charset=utf-8">
<meta name=Generator content="Microsoft Word 11 (filtered medium)">
<!--[if !mso]>
<style>
v\:* {behavior:url(#default#VML);}
o\:* {behavior:url(#default#VML);}
w\:* {behavior:url(#default#VML);}
.shape {behavior:url(#default#VML);}
</style>
<![endif]--><o:SmartTagType
 namespaceuri="urn:schemas-microsoft-com:office:smarttags" name="PlaceName"/>
<o:SmartTagType namespaceuri="urn:schemas-microsoft-com:office:smarttags"
 name="PlaceType"/>
<o:SmartTagType namespaceuri="urn:schemas-microsoft-com:office:smarttags"
 name="country-region"/>
<o:SmartTagType namespaceuri="urn:schemas-microsoft-com:office:smarttags"
 name="place"/>
<o:SmartTagType namespaceuri="urn:schemas-microsoft-com:office:smarttags"
 name="Street"/>
<o:SmartTagType namespaceuri="urn:schemas-microsoft-com:office:smarttags"
 name="address"/>
<!--[if !mso]>
<style>
st1\:*{behavior:url(#default#ieooui) }
</style>
<![endif]-->
<style>
<!--
 /* Font Definitions */
 @font-face
        {font-family:Tahoma;
        panose-1:2 11 6 4 3 5 4 4 2 4;}
 /* Style Definitions */
 p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0cm;
        margin-bottom:.0001pt;
        font-size:12.0pt;
        font-family:"Times New Roman";}
a:link, span.MsoHyperlink
        {color:blue;
        text-decoration:underline;}
a:visited, span.MsoHyperlinkFollowed
        {color:purple;
        text-decoration:underline;}
p
        {mso-margin-top-alt:auto;
        margin-right:0cm;
        mso-margin-bottom-alt:auto;
        margin-left:0cm;
        font-size:12.0pt;
        font-family:"Times New Roman";}
span.Shkpostityyli17
        {mso-style-type:personal-reply;
        font-family:Arial;
        color:windowtext;
        font-weight:normal;
        font-style:normal;
        text-decoration:none none;}
@page Section1
        {size:595.3pt 841.9pt;
        margin:2.0cm 2.0cm 2.0cm 2.0cm;}
div.Section1
        {page:Section1;}
-->
</style>

</head>

<body lang=FI link=blue vlink=purple>

<div class=Section1>

<p class=MsoNormal><font size=2 face=Arial><span style='font-size:11.0pt;
font-family:Arial'>Dear Simon,<o:p></o:p></span></font></p>

<p class=MsoNormal><font size=2 face=Arial><span style='font-size:11.0pt;
font-family:Arial'><o:p> </o:p></span></font></p>

<p class=MsoNormal><font size=2 face=Arial><span lang=EN-GB style='font-size:
11.0pt;font-family:Arial'>Perhaps you would like to have a look at the ICLFI
Corpus -  the International Corpus of Learner Finnish that is collected at the <st1:PlaceType
w:st="on">University</st1:PlaceType> of <st1:PlaceName w:st="on">Oulu</st1:PlaceName>
in <st1:place w:st="on"><st1:country-region w:st="on">Finland</st1:country-region></st1:place>.
That corpus also includes a subcorpus of learner Finnish produced by Chinese
language learners. The size of the total corpus is approximately 320 000 tokens
at the moment.<o:p></o:p></span></font></p>

<p class=MsoNormal><font size=2 face=Arial><span lang=EN-GB style='font-size:
11.0pt;font-family:Arial'><o:p> </o:p></span></font></p>

<p class=MsoNormal><font size=2 face=Arial><span lang=EN-GB style='font-size:
11.0pt;font-family:Arial'>The description of the ICLFI Corpus can be found at
the web page <a
href="http://www.oulu.fi/hutk/sutvi/oppijankieli/ICLFI_Corpus.html">http://www.oulu.fi/hutk/sutvi/oppijankieli/ICLFI_Corpus.html</a><o:p></o:p></span></font></p>

<p class=MsoNormal><font size=2 face=Arial><span lang=EN-GB style='font-size:
11.0pt;font-family:Arial'><o:p> </o:p></span></font></p>

<p class=MsoNormal><font size=2 face=Arial><span lang=EN-GB style='font-size:
11.0pt;font-family:Arial'>Best wishes,<o:p></o:p></span></font></p>

<p class=MsoNormal><font size=2 face=Arial><span lang=EN-GB style='font-size:
11.0pt;font-family:Arial'>Jarmo Harri Jantunen<o:p></o:p></span></font></p>

<div>

<p><font size=2 face=Arial><span lang=EN-GB style='font-size:11.0pt;font-family:
Arial'>Adjunct professor, senior lecturer<br>
<br>
<br>
Finnish as a Second and Foreign Language<br>
Faculty of Humanities<br>
<st1:address w:st="on"><st1:Street w:st="on">P.O. Box</st1:Street> 1000</st1:address><br>
FI-90014 <st1:place w:st="on"><st1:PlaceType w:st="on">University</st1:PlaceType>
 of <st1:PlaceName w:st="on">Oulu</st1:PlaceName></st1:place><br>
<st1:country-region w:st="on"><st1:place w:st="on">Finland</st1:place></st1:country-region><br>
Tel. </span></font><font size=2 face=Arial><span style='font-size:11.0pt;
font-family:Arial'>+358 8 553 3478<br>
<a href="http://www.oulu.fi/hutk/sutvi/henkilokunta/jjantunen.html">http://www.oulu.fi/hutk/sutvi/henkilokunta/jjantunen.html</a><br>
<a href="http://www.oulu.fi/hutk/sutvi/oppijankieli">http://www.oulu.fi/hutk/sutvi/oppijankieli</a></span></font><font
size=2 face=Arial><span style='font-size:11.0pt;font-family:Arial'><o:p></o:p></span></font></p>

</div>

<div>

<div class=MsoNormal align=center style='text-align:center'><font size=3
face="Times New Roman"><span style='font-size:12.0pt'>

<hr size=2 width="100%" align=center tabindex=-1>

</span></font></div>

<p class=MsoNormal><b><font size=2 face=Tahoma><span style='font-size:10.0pt;
font-family:Tahoma;font-weight:bold'>Lähettäjä:</span></font></b><font size=2
face=Tahoma><span style='font-size:10.0pt;font-family:Tahoma'>
corpora-bounces@uib.no [mailto:corpora-bounces@uib.no] <b><span
style='font-weight:bold'>Puolesta </span></b>simon smith<br>
<b><span style='font-weight:bold'>Lähetetty:</span></b> 24. helmikuuta 2009
7:20<br>
<b><span style='font-weight:bold'>Vastaanottaja:</span></b> CORPORA@uib.no<br>
<b><span style='font-weight:bold'>Aihe:</span></b> [Corpora-List] Learner
corpora build & query tool?</span></font><o:p></o:p></p>

</div>

<p class=MsoNormal><font size=3 face="Times New Roman"><span style='font-size:
12.0pt'><o:p> </o:p></span></font></p>

<div>

<p class=MsoNormal><font size=3 face="Times New Roman"><span style='font-size:
12.0pt'>I've been looking over the resources recommended to Mieke van der
Velden on the list with considerable interest. <o:p></o:p></span></font></p>

</div>

<div>

<p class=MsoNormal><font size=3 face="Times New Roman"><span style='font-size:
12.0pt'> <o:p></o:p></span></font></p>

</div>

<div>

<p class=MsoNormal><font size=3 face="Times New Roman"><span style='font-size:
12.0pt'>Here at NCCU in Taiwan, we have 8 language departments -- English,
French, German, Korean, Japanese, Spanish, Arabic, Turkish -- and we plan to
build a learner corpus for each. Although this sounds like an ambitious scheme,
it has support and funding from the central university administration.<br>
<br>
The people studying these languages, here in Taiwan, are native speakers of
Chinese. I'm aware of Chinese speaker learner corpora of some of the languages:
English obviously, Spanish and Japanese (and German planned) at National
Chengkung University. But I'm interested to know if any of our planned corpora
will be firsts. It seems pretty unlikely that there exists a Chinese speaker LC
of Turkish, for example. So if you are reading this, and you know of an
existing Chinese speaker LC of one of our languages, perhaps you could let me
know.<o:p></o:p></span></font></p>

</div>

<div>

<p class=MsoNormal><font size=3 face="Times New Roman"><span style='font-size:
12.0pt'> <o:p></o:p></span></font></p>

</div>

<div>

<p class=MsoNormal style='margin-bottom:12.0pt'><font size=3
face="Times New Roman"><span style='font-size:12.0pt'>It's a longish-term
project, and we're not too clear at the moment what sort of interlanguage
annotation or correction we'll be doing. Right now, the important thing is to
start collecting data. We could probably create our own interface to do this,
but I wonder if there is a (free or shareware) product out there that we could
use for LC building.<br>
<br>
It would need to be pretty straightforward to use, because the language
teachers collaborating will have no experience of corpora or corpus
linguistics. Some of them will, indeed, have very little computer experience at
all.<br>
<br>
Ideally, we would collect the data (as homework assignments) directly from
students. I'm wondering about the possibility of using Moodle for this, either
the Database or Wiki modules ( there is a Corpus module but it's not supported
any more). The students would input their data, and everyone would be able to
see it. In the Wiki, we could allow teachers to edit it, and a record of
changes would be kept.<br>
<br>
But I'm not how easy it would be to do annotation of a "corpus" in
that format, or really analyse it in a conventional way. There would be no
obvious way of generating a concordance, for example. <br>
<br>
I really like the idea of a shared resource which can be built, updated,
consulted and used by learners, all via the same interface.<br>
<br>
Any thoughts anyone?<br>
<br>
歡迎以中文回信<br>
<br>
Simon Smith, PhD<br>
<br>
Assistant Professor<br>
Foreign Language Center<br>
National Chengchi University<br>
<br>
office: Research Building 416 <br>
phone:  (0)2 2939 3091  x 88015<br>
fax  +44 (0)871 243 1512 <o:p></o:p></span></font></p>

</div>

</div>

</body>

</html>