<div dir="ltr">I share my answer.<br><br><div class="gmail_quote">---------- Forwarded message ----------<br>From: <b class="gmail_sendername">Michele Filannino</b> <span dir="ltr"><<a href="mailto:michele.filannino@cs.manchester.ac.uk">michele.filannino@cs.manchester.ac.uk</a>></span><br>
Date: Thu, Jun 27, 2013 at 2:31 PM<br>Subject: Re: [Corpora-List] The standard size of splitting the dataset<br>To: Jack Alan <<a href="mailto:j.o.alan2012@gmail.com">j.o.alan2012@gmail.com</a>><br><br><br><div dir="ltr">
Hi Jack,<div><br></div><div>the question is exhaustively addressed in the attached paper.</div><div><br></div><div>Bye,</div><div>michele.</div><div><br></div></div><div class="gmail_extra"><br><br><div class="gmail_quote">
<div><div class="h5">
On Thu, Jun 27, 2013 at 1:58 PM, Jack Alan <span dir="ltr"><<a href="mailto:j.o.alan2012@gmail.com" target="_blank">j.o.alan2012@gmail.com</a>></span> wrote:<br></div></div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<div><div class="h5">
<div dir="ltr">Hi all,<div><br></div><div>Has anyone came across the standard size of splitting the dataset into (training, development and test) in supervised learning? I mean what is the typical percentage size for each subset especially for sequence labelling tasks, e.g. POS and NER?</div>


<div><br></div><div>I wonder if it is something like 60% training, 20% development and 20% test?</div><div><br></div><div>Many thanks</div></div>
<br></div></div>_______________________________________________<br>
UNSUBSCRIBE from this page: <a href="http://mailman.uib.no/options/corpora" target="_blank">http://mailman.uib.no/options/corpora</a><br>
Corpora mailing list<br>
<a href="mailto:Corpora@uib.no" target="_blank">Corpora@uib.no</a><br>
<a href="http://mailman.uib.no/listinfo/corpora" target="_blank">http://mailman.uib.no/listinfo/corpora</a><br>
<br></blockquote></div><span class="HOEnZb"><font color="#888888"><br><br clear="all"><div><br></div>-- <br>Michele Filannino<br><br><font color="#666666">CDT PhD student in Computer Science<br>Room IT301 - IT Building<br>
The University of Manchester<br><a href="mailto:filannim@cs.manchester.ac.uk" target="_blank">filannim@cs.manchester.ac.uk</a></font>
</font></span></div>
</div><br><br clear="all"><div><br></div>-- <br>Michele Filannino<br><br><font color="#666666">CDT PhD student in Computer Science<br>Room IT301 - IT Building<br>The University of Manchester<br><a href="mailto:filannim@cs.manchester.ac.uk" target="_blank">filannim@cs.manchester.ac.uk</a></font>
</div>