Hi Michael,<div><br></div><div>Very interesting resource. I will analysis this corpus deeply.</div><div><br></div><div>Actually, I believe the machine learning process for natural language should follow the way of human children. I may find some clew in this corpus.</div>
<div><br></div><div>Thanks you.</div><div>Nathan<br><br><div class="gmail_quote">On Fri, Mar 11, 2011 at 12:46 AM, Michael Israel <span dir="ltr"><<a href="mailto:michael.israel@gmail.com">michael.israel@gmail.com</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex;">Nathan,<br><br>You may be right that children's English is not itself the best input for children learning English, but  CHILDES includes many transcripts from in-depth longitudinal studies of acquisition, and these include both what the children say, and what is said to them. Indeed, in many transcripts the majority of words spoken come from adults and are directed to children. There is also a great deal of research based on this data showing that the words and grammatical constructions which children learn are in many (but not all) respects highly correlated with the frequency with these occur in the spoken input that the children hear. So, CHILDES might be more relevant than you think.<br>

<br>regards,<br>Michael<br><br><br><br><div class="gmail_quote">2011/3/10 Nathan Hu <span dir="ltr"><<a href="mailto:nathan3dvrlab@gmail.com" target="_blank">nathan3dvrlab@gmail.com</a>></span><div><div></div><div class="h5">
<br><blockquote class="gmail_quote" style="margin:0pt 0pt 0pt 0.8ex;border-left:1px solid rgb(204, 204, 204);padding-left:1ex">
Dear Grzegorz,<div><br></div><div>Thank you for your help. </div><div><br></div><div>However, the children's English is different from English for children. Children's English does not easily to learn. </div><div>

<br>
</div><div>Regards,</div><div>Nathan <br><br><div class="gmail_quote">2011/3/10 Grzegorz Chrupała <span dir="ltr"><<a href="mailto:gchrupala@lsv.uni-saarland.de" target="_blank">gchrupala@lsv.uni-saarland.de</a>></span><div>

<br><blockquote class="gmail_quote" style="margin:0pt 0pt 0pt 0.8ex;border-left:1px solid rgb(204, 204, 204);padding-left:1ex">
Dear Nathan,<br>
<br>
The CHILDES database contains transcript of conversations between<br>
young children and their playmates and caretakers in a number of<br>
languages: <a href="http://childes.psy.cmu.edu/data/" target="_blank">http://childes.psy.cmu.edu/data/</a> . It is spoken rather than<br>
written language but may still suit your needs.<br>
<font color="#888888">--<br>
'gʒɛgɔʃ<br>
</font><div><div></div><div><br>
<br>
<br>
On Wed, Mar 9, 2011 at 23:31, Nathan Hu <<a href="mailto:nathan3dvrlab@gmail.com" target="_blank">nathan3dvrlab@gmail.com</a>> wrote:<br>
> Hi All,<br>
> In my research, I believe the automated learning system need to start from<br>
> simple text like human child.<br>
> Where can I find a large simple English corpus such as stories for children?<br>
> Thank you.<br>
> Nathan<br>
</div></div><div><div></div><div>> _______________________________________________<br>
> Corpora mailing list<br>
> <a href="mailto:Corpora@uib.no" target="_blank">Corpora@uib.no</a><br>
> <a href="http://mailman.uib.no/listinfo/corpora" target="_blank">http://mailman.uib.no/listinfo/corpora</a><br>
><br>
><br>
</div></div></blockquote></div></div><br></div>
<br>_______________________________________________<br>
Corpora mailing list<br>
<a href="mailto:Corpora@uib.no" target="_blank">Corpora@uib.no</a><br>
<a href="http://mailman.uib.no/listinfo/corpora" target="_blank">http://mailman.uib.no/listinfo/corpora</a><br>
<br></blockquote></div></div></div><br>
</blockquote></div><br></div>