<div dir="ltr">In using the Spanish tagger, I have come across the following consistent error: determiners (la, los, las) are consistently mislabeled as their homophonous clitics. See the following example from the most recent version of Orea-Pine corpus.<div><br></div><div>Ex. 36    *FAT:<span class="Apple-tab-span" style="white-space: pre;">  </span>coge Papá <span style="background-color: rgb(255, 255, 0);">los</span> señores ?</div><div>%mor:<span class="Apple-tab-span" style="white-space:pre">        </span>v|coge-3S&PRES=take n:prop|Papá <span style="background-color: rgb(255, 255, 0);">pro:obj|él&m-PL=he</span> n|señor&m-PL=sir</div><div><span class="Apple-tab-span" style="white-space:pre">    </span>?</div><div><br></div><div>The correct label should be: <span style="background-color: rgb(255, 255, 0);">det:art|el&m&PL=the</span></div><div><br></div><div>While MOR correctly provides both labels, POST often chooses the wrong label. I see many cases of determiners mislabeled as clitics, but not the reverse.</div><div><br></div><div>My question is:</div><div><ol><li>Can this problem be overcome by modifying POST?</li><li>Does any corpus exist that does not have this error?</li></ol></div></div>

<p></p>

-- <br />
You received this message because you are subscribed to the Google Groups "chibolts" group.<br />
To unsubscribe from this group and stop receiving emails from it, send an email to <a href="mailto:chibolts+unsubscribe@googlegroups.com">chibolts+unsubscribe@googlegroups.com</a>.<br />
To post to this group, send email to <a href="mailto:chibolts@googlegroups.com">chibolts@googlegroups.com</a>.<br />
To view this discussion on the web visit <a href="https://groups.google.com/d/msgid/chibolts/a8cbb762-31b6-447c-ac51-6427c17d15e2%40googlegroups.com?utm_medium=email&utm_source=footer">https://groups.google.com/d/msgid/chibolts/a8cbb762-31b6-447c-ac51-6427c17d15e2%40googlegroups.com</a>.<br />
For more options, visit <a href="https://groups.google.com/d/optout">https://groups.google.com/d/optout</a>.<br />