<html><head><meta http-equiv="Content-Type" content="text/html; charset=utf-8"></head><body style="word-wrap: break-word; -webkit-nbsp-mode: space; line-break: after-white-space;" class="">Dear Janet,<div class="">    Typically, automatic taggers get about 95% of the words right.  The best for adult written English are up to 97%.  For CHILDES English, we can hit about 97%.  For Spanish, we are probably down around 95%, although sometimes it seems better.  </div><div class=""><br class=""></div><div class="">In the case of ratito, you must be using some much earlier version of SPA MOR.  The current version doesn't have this problem.  The case of bonita is different. It created a few test sentences and it seems that this problem arises when bonita is the last word in the sentences, as in "es una niña bonita".  The problem is that the association of "co" with final position is so strong that it overrides the association of an adjective with the preceding noun.  This can be corrected with a couple of prepost rules that take words that can be either co or adj and force them to be adj when they follow a noun.  Here are the rules:</div><div class=""><br class=""></div><div class=""><div class=""><div class=""># es una gata bonita</div><div class="">n|* co:voc|*^adj|* => n|* adj|*</div><div class=""># es una niña bonita</div><div class="">co:voc|*^n|* co:voc|*^adj|* => n|* adj|*</div></div><div class=""><br class=""></div><div class="">These work for these cases, but (1) you may have other cases I don't know about, and (2) prepost rules can also mess up other things.  So, please give this a try.</div><div class=""><br class=""></div><div class="">--Brian</div><div><br class=""><blockquote type="cite" class=""><div class="">On Jan 16, 2020, at 8:47 PM, Janet Y Bang <<a href="mailto:jbang@stanford.edu" class="">jbang@stanford.edu</a>> wrote:</div><br class="Apple-interchange-newline"><div class=""><div style="font-style: normal; font-variant-caps: normal; font-weight: normal; letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration: none; font-family: Calibri, Arial, Helvetica, sans-serif; font-size: 12pt;" class="">Hello, </div><div style="font-style: normal; font-variant-caps: normal; font-weight: normal; letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration: none; font-family: Calibri, Arial, Helvetica, sans-serif; font-size: 12pt;" class=""><br class=""></div><div style="font-style: normal; font-variant-caps: normal; font-weight: normal; letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration: none; font-family: Calibri, Arial, Helvetica, sans-serif; font-size: 12pt;" class="">We are working with the Spanish MOR and noticed a few errors in the MOR line: </div><div style="font-style: normal; font-variant-caps: normal; font-weight: normal; letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration: none; font-family: Calibri, Arial, Helvetica, sans-serif; font-size: 12pt;" class=""><br class=""></div><div style="font-style: normal; font-variant-caps: normal; font-weight: normal; letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration: none; font-family: Calibri, Arial, Helvetica, sans-serif; font-size: 12pt;" class=""><ol class=""><li class=""><span style="font-family: Arial, Helvetica, sans-serif; font-size: 12pt;" class="">bonita oftentimes gets broken d</span><span style="font-family: Arial, Helvetica, sans-serif; font-size: 12pt;" class="">own into </span><span style="color: rgb(34, 34, 34); font-family: Arial, Helvetica, sans-serif; font-size: 12pt; text-align: start; background-color: rgb(255, 255, 255); display: inline !important;" class="">co:voc|bonita=pretty in cases where the word "bonita" is being used to modify a noun, e.g., utterance is "niña bonita. </span></li><li class=""><span style="color: rgb(34, 34, 34); font-family: Arial, Helvetica, sans-serif; font-size: 12pt; text-align: start; background-color: rgb(255, 255, 255); display: inline !important;" class=""><span style="font-family: Arial, Helvetica, sans-serif; font-size: 12pt; background-color: rgb(255, 255, 255); display: inline !important;" class="">In cases were "rato" or "ratito" is used to indicate a period of time, oftentimes the breakdown is </span></span><span style="font-family: Arial, Helvetica, sans-serif; font-size: 12pt;" class="">n|rato&m-DIM=rat OR<span class="Apple-converted-space"> </span></span><span style="font-family: Arial, Helvetica, sans-serif; font-size: 12pt;" class="">n|rato-m=rat. <br class=""></span></li></ol><div class="">What would be the most efficient way to fix these errors? We have a lab-internal .cut file where we are adding new words to our internal mor dictionary that were not in the downloaded dictionary (so that we can keep track of differences between our lab lexical items and the downloaded dictionary), but we weren't sure how to override words that were already in the dictionary? Would it be best to fix these in the relevant cut files in the lex folder (i.e., adj.cut, n.cut, respectively)? </div><div class=""><br class=""></div><div class="">Thank you,</div><div class="">Janet</div></div><div style="font-style: normal; font-variant-caps: normal; font-weight: normal; letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration: none; font-family: Calibri, Arial, Helvetica, sans-serif; font-size: 12pt;" class=""><br class=""></div><div id="Signature" style="caret-color: rgb(0, 0, 0); font-family: Helvetica; font-size: 14px; font-style: normal; font-variant-caps: normal; font-weight: normal; letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration: none;" class=""><div id="divtagdefaultwrapper" dir="ltr" style="font-size: 12pt; font-family: Calibri, Helvetica, sans-serif;" class=""><div style="margin-top: 0px; margin-bottom: 0px;" class="">--</div><div style="margin-top: 0px; margin-bottom: 0px;" class=""><span style="font-size: 10pt;" class="">Janet Y. Bang, Ph.D.</span></div><span style="font-size: 10pt;" class=""></span><div style="margin-top: 0px; margin-bottom: 0px;" class=""><span style="font-size: 10pt;" class="">Postdoctoral Fellow</span></div><span style="font-size: 10pt;" class=""></span><div style="margin-top: 0px; margin-bottom: 0px;" class=""><span style="font-size: 10pt;" class="">Department of </span><span style="font-size: 10pt;" class="">Psychology</span></div><span style="font-size: 10pt;" class=""></span><div style="margin-top: 0px; margin-bottom: 0px;" class=""><span style="font-size: 10pt;" class="">Stanford University</span></div><span style="font-size: 10pt;" class=""></span><div style="margin-top: 0px; margin-bottom: 0px;" class=""><br class=""><span style="font-size: 10pt;" class=""></span></div><span style="font-size: 10pt;" class=""></span><div style="margin-top: 0px; margin-bottom: 0px;" class=""><span style="font-size: 10pt;" class=""><a href="mailto:jbang@stanford.edu" class="">jbang@stanford.edu</a></span></div><p style="margin-top: 0px; margin-bottom: 0px;" class=""></p><div style="margin-top: 0px; margin-bottom: 0px;" class=""><br class=""></div><div style="margin-top: 0px; margin-bottom: 0px;" class=""><br class=""></div><div style="margin-top: 0px; margin-bottom: 0px;" class=""><br class=""></div><div style="margin-top: 0px; margin-bottom: 0px;" class=""><br class=""></div></div></div><p style="margin-top: 0px; margin-bottom: 0px; caret-color: rgb(0, 0, 0); font-family: Helvetica; font-size: 14px; font-style: normal; font-variant-caps: normal; font-weight: normal; letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration: none;" class=""></p><span style="caret-color: rgb(0, 0, 0); font-family: Helvetica; font-size: 14px; font-style: normal; font-variant-caps: normal; font-weight: normal; letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration: none; float: none; display: inline !important;" class="">--<span class="Apple-converted-space"> </span></span><br style="caret-color: rgb(0, 0, 0); font-family: Helvetica; font-size: 14px; font-style: normal; font-variant-caps: normal; font-weight: normal; letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration: none;" class=""><span style="caret-color: rgb(0, 0, 0); font-family: Helvetica; font-size: 14px; font-style: normal; font-variant-caps: normal; font-weight: normal; letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration: none; float: none; display: inline !important;" class="">You received this message because you are subscribed to the Google Groups "chibolts" group.</span><br style="caret-color: rgb(0, 0, 0); font-family: Helvetica; font-size: 14px; font-style: normal; font-variant-caps: normal; font-weight: normal; letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration: none;" class=""><span style="caret-color: rgb(0, 0, 0); font-family: Helvetica; font-size: 14px; font-style: normal; font-variant-caps: normal; font-weight: normal; letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration: none; float: none; display: inline !important;" class="">To unsubscribe from this group and stop receiving emails from it, send an email to<span class="Apple-converted-space"> </span></span><a href="mailto:chibolts+unsubscribe@googlegroups.com" style="font-family: Helvetica; font-size: 14px; font-style: normal; font-variant-caps: normal; font-weight: normal; letter-spacing: normal; orphans: auto; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; widows: auto; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px;" class="">chibolts+unsubscribe@googlegroups.com</a><span style="caret-color: rgb(0, 0, 0); font-family: Helvetica; font-size: 14px; font-style: normal; font-variant-caps: normal; font-weight: normal; letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration: none; float: none; display: inline !important;" class="">.</span><br style="caret-color: rgb(0, 0, 0); font-family: Helvetica; font-size: 14px; font-style: normal; font-variant-caps: normal; font-weight: normal; letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration: none;" class=""><span style="caret-color: rgb(0, 0, 0); font-family: Helvetica; font-size: 14px; font-style: normal; font-variant-caps: normal; font-weight: normal; letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration: none; float: none; display: inline !important;" class="">To view this discussion on the web visit<span class="Apple-converted-space"> </span></span><a href="https://groups.google.com/d/msgid/chibolts/DM5PR02MB3275154B3A345DAA4BD9B5A2D7310%40DM5PR02MB3275.namprd02.prod.outlook.com?utm_medium=email&utm_source=footer" style="font-family: Helvetica; font-size: 14px; font-style: normal; font-variant-caps: normal; font-weight: normal; letter-spacing: normal; orphans: auto; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; widows: auto; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px;" class="">https://groups.google.com/d/msgid/chibolts/DM5PR02MB3275154B3A345DAA4BD9B5A2D7310%40DM5PR02MB3275.namprd02.prod.outlook.com</a><span style="caret-color: rgb(0, 0, 0); font-family: Helvetica; font-size: 14px; font-style: normal; font-variant-caps: normal; font-weight: normal; letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration: none; float: none; display: inline !important;" class="">.</span></div></blockquote></div><br class=""></div></body></html>

<p></p>

-- <br />
You received this message because you are subscribed to the Google Groups "chibolts" group.<br />
To unsubscribe from this group and stop receiving emails from it, send an email to <a href="mailto:chibolts+unsubscribe@googlegroups.com">chibolts+unsubscribe@googlegroups.com</a>.<br />
To view this discussion on the web visit <a href="https://groups.google.com/d/msgid/chibolts/ECE843B9-F0F4-4D19-920D-BE7D4DD5F425%40andrew.cmu.edu?utm_medium=email&utm_source=footer">https://groups.google.com/d/msgid/chibolts/ECE843B9-F0F4-4D19-920D-BE7D4DD5F425%40andrew.cmu.edu</a>.<br />