<div dir="ltr">Hi all,<div><br></div><div style>Has anyone came across the standard size of splitting the dataset into (training, development and test) in supervised learning? I mean what is the typical percentage size for each subset especially for sequence labelling tasks, e.g. POS and NER?</div>
<div style><br></div><div style>I wonder if it is something like 60% training, 20% development and 20% test?</div><div style><br></div><div style>Many thanks</div></div>