<html><head><meta http-equiv="Content-Type" content="text/html charset=windows-1252"></head><body style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space;">Rui,<div><br></div><div><span class="Apple-tab-span" style="white-space:pre">   </span>I forgot to mention one more exception for tags. Any word that ends with a "@..." symbol is converted to MOR tag using "sf.cut" file located in grammar's root folder. For English example, this file will be in eng folder.</div><div><br></div><div>Tags that are separated by '+' characters are compound words. Those are words that are made up of two or more different words to create a new word. For example, in English word "hopscotch" consist of two words "hop" and "scotch" and it is listed in lexicon file "n+v+n.cut". MOR command tags this word as " n|+v|hop+n|scotch" the first tag is a noun, "n|", and is an overall tag for the word, The second tag "v|" indicates that word "hop" is a verb and the third tag "n|" indicates that word "scotch" is a noun. Thus in FREQ output you would see "n|+v+n" tag. The other compound tags are more complicated. For example, word "iceskating" consists on two words "ice" and "skating". "ice" is a noun, "n|", and  word "skating" consists of parts "skate" and "ing", i.e. "n|" and "n:gerund|". Thus resulting tag for word "iceskating" is "n:gerund|+n+n". Compound words can either be literally listed in lex file like word "hopscotch" or can consist of tags representing its components like word "iceskating".</div><div><br></div><div>So, all the tags in MOR come from lex files, sf.cut file and $part-of-speech tag on main speaker tier. But, how those tags are arranged together in the end is a function of MOR command.<br><div><br class="webkit-block-placeholder"></div><div apple-content-edited="true">
<div>For more information I strongly encourage you to read chapter "11 MOR – Morphosyntactic Analysis" in CLAN's manual located at URL:</div><div><a href="http://childes.talkbank.org/manuals/CLAN.pdf">http://childes.talkbank.org/manuals/CLAN.pdf</a></div><div><br></div><div><br></div><span style="color: rgb(0, 0, 0); font-family: 'Lucida Grande'; font-size: 12px; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: normal; orphans: auto; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; widows: auto; word-spacing: 0px; -webkit-text-stroke-width: 0px; display: inline !important; float: none;">Leonid.</span>

</div>
<br><div><div>On May 6, 2014, at 11:41, Rui Huang <<a href="mailto:huang3740@gmail.com">huang3740@gmail.com</a>> wrote:</div><br class="Apple-interchange-newline"><blockquote type="cite"><div dir="ltr">Hi Leonid,<div><br><div>I am sorry to say that the command 'freq -y +s"[scat *]" +u *.cut' does not list all the tags. I ran 'freq +s@|*,o% filenames' on Eve and Valian corpus, and then collected all the tags that appear in the output, I found some tags are not in the  'freq -y +s"[scat *]" +u *.cut' output. (Attached is my output. Tags appear in orange color is not in the  'freq -y +s"[scat *]" +u *.cut' output.)</div><div><br></div><div>  In addition, I do not know the meaning of some tags that links by '+' symbol, like ''adv|+adj+n', 'adj+adj+adj', 'n+n+n', 'n+n+adj', and so on. Do you know them?</div><div>Thank you. </div><div><br></div><div><br></div><div><br>On Tuesday, April 29, 2014 5:46:37 PM UTC-4, Spektor, Leonid: CMU wrote:<blockquote class="gmail_quote" style="margin: 0px 0px 0px 0.8ex; border-left-width: 1px; border-left-color: rgb(204, 204, 204); border-left-style: solid; padding-left: 1ex; position: static; z-index: auto;"><div style="word-wrap:break-word">Hi Rui,<div><br></div><div><span style="white-space:pre"> </span>"n:prop" is the ONLY tag in all MOR grammars that is hardwired into CLAN itself. If MOR see a capitalized word, then it tags it with "n:prop". There is also a way in CHAT to specify any tag on speaker tier too. For example, tier:</div><div><br></div><div>*CHI:<span style="white-space:pre">          </span>word$foo .</div><div><br></div><div>will result in %mor tier:</div><div><br></div><div>%mor:<span style="white-space:pre">     </span>foo|word .</div><div><br></div><div>Beside above exceptions the command "freq -y +s"[scat *]" +u *.cut" will lists all the tags.<br><div>
<br><span style="font-family: 'Lucida Grande'; font-size: 12px; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; float: none; display: inline !important;">Leonid.</span>

</div>
<br><div><div>On Apr 29, 2014, at 12:01, Rui Huang <<a href="javascript:" target="_blank" gdf-obfuscated-mailto="IrPjhAsak-YJ" onmousedown="this.href='javascript:';return true;" onclick="this.href='javascript:';return true;">huan...@gmail.com</a>> wrote:</div><br><blockquote type="cite"><div dir="ltr">Hi Leonid,<div><br></div><div>Thank you for answering my question. The first command pulls out all tags in a file. It works very well. </div><div>But the second command does not pull out all the tags that eng MOR grammar has. And this is what I need to find.</div><div>For example, in Valian corpus:</div><div><br></div><div><div>*MOT:<span style="white-space:pre"> </span>Child's !</div><div>%mor:<span style="white-space:pre">        </span>n:prop|Child~poss|s !</div><div>%gra:<span style="white-space:pre">    </span>1|2|MOD 2|0|ROOT 3|2|PUNCT</div><div><br></div><div>The tag 'n:prop' should appear in the output, but it did not. Hope you can take a look at it.</div><div>Thank you again!</div><div><br></div><div>Rui</div><div><br></div><br>On Thursday, April 24, 2014 7:49:02 PM UTC-4, Spektor, Leonid: CMU wrote:<blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex"><div style="word-wrap:break-word">Hi Rui,<div><br></div><div><span style="white-space:pre">  </span>You can try command:</div><div><br></div><div>freq +s@|*,o% filenames</div><div><br></div><div>If you are interested in all tags that a particular MOR grammar has, then you need to download a grammar you are interested in, set CLAN's "working" directory to "<grammar name>/lex" folder. For English grammar that would be "eng/lex" and run command:</div><div><br></div><div>freq -y +s"[scat *]" +u *.cut</div><div><br></div><div><div>
<br><span style="font-family:'Lucida Grande';font-size:12px;font-style:normal;font-variant:normal;font-weight:normal;letter-spacing:normal;line-height:normal;text-align:start;text-indent:0px;text-transform:none;white-space:normal;word-spacing:0px;float:none;display:inline!important">Leonid.</span>

</div>
<br><div><div>On Apr 24, 2014, at 18:08, Rui Huang <<a>huan...@gmail.com</a>> wrote:</div><br><blockquote type="cite"><div dir="ltr">Hello everyone, <div><br><div>  I have a question that Erin has asked before, but did not get reply. (<a href="https://groups.google.com/forum/#!searchin/chibolts/erin/chibolts/5N8m43WrCZs/jSkHAm6aSY8J" target="_blank" onmousedown="this.href='https://groups.google.com/forum/#!searchin/chibolts/erin/chibolts/5N8m43WrCZs/jSkHAm6aSY8J';return true;" onclick="this.href='https://groups.google.com/forum/#!searchin/chibolts/erin/chibolts/5N8m43WrCZs/jSkHAm6aSY8J';return true;">https://groups.google.com/<wbr>forum/#!searchin/chibolts/<wbr>erin/chibolts/5N8m43WrCZs/<wbr>jSkHAm6aSY8J</a>)</div><div>  Is there a comprehensive list of tags used by MOR?  How can I tell CLAN to give me a list that all speech tags it used in a certain file?</div></div><div><br></div><div>Thank you.</div><div>Rui</div><div><br></div><div><br></div></div><div><br></div>

-- <br>
You received this message because you are subscribed to the Google Groups "chibolts" group.<br>
To unsubscribe from this group and stop receiving emails from it, send an email to <a>chibolts+u...@googlegroups.com</a><wbr>.<br>
To post to this group, send email to <a>chib...@googlegroups.com</a>.<br>
To view this discussion on the web visit <a href="https://groups.google.com/d/msgid/chibolts/407a8ece-ff8d-4603-a934-63b32abc9e01%40googlegroups.com?utm_medium=email&utm_source=footer" target="_blank" onmousedown="this.href='https://groups.google.com/d/msgid/chibolts/407a8ece-ff8d-4603-a934-63b32abc9e01%40googlegroups.com?utm_medium\75email\46utm_source\75footer';return true;" onclick="this.href='https://groups.google.com/d/msgid/chibolts/407a8ece-ff8d-4603-a934-63b32abc9e01%40googlegroups.com?utm_medium\75email\46utm_source\75footer';return true;">https://groups.google.com/d/<wbr>msgid/chibolts/407a8ece-ff8d-<wbr>4603-a934-63b32abc9e01%<wbr>40googlegroups.com</a>.<br>
For more options, visit <a href="https://groups.google.com/d/optout" target="_blank" onmousedown="this.href='https://groups.google.com/d/optout';return true;" onclick="this.href='https://groups.google.com/d/optout';return true;">https://groups.google.com/d/<wbr>optout</a>.<br>
</blockquote></div><br></div></div></blockquote></div></div><div><br></div>

-- <br>
You received this message because you are subscribed to the Google Groups "chibolts" group.<br>
To unsubscribe from this group and stop receiving emails from it, send an email to <a href="javascript:" target="_blank" gdf-obfuscated-mailto="IrPjhAsak-YJ" onmousedown="this.href='javascript:';return true;" onclick="this.href='javascript:';return true;">chibolts+u...@<wbr>googlegroups.com</a>.<br>
To post to this group, send email to <a href="javascript:" target="_blank" gdf-obfuscated-mailto="IrPjhAsak-YJ" onmousedown="this.href='javascript:';return true;" onclick="this.href='javascript:';return true;">chib...@googlegroups.com</a>.<br>
To view this discussion on the web visit <a href="https://groups.google.com/d/msgid/chibolts/d58a6a70-470c-4eec-9406-56a6daba19a1%40googlegroups.com?utm_medium=email&utm_source=footer" target="_blank" onmousedown="this.href='https://groups.google.com/d/msgid/chibolts/d58a6a70-470c-4eec-9406-56a6daba19a1%40googlegroups.com?utm_medium\75email\46utm_source\75footer';return true;" onclick="this.href='https://groups.google.com/d/msgid/chibolts/d58a6a70-470c-4eec-9406-56a6daba19a1%40googlegroups.com?utm_medium\75email\46utm_source\75footer';return true;">https://groups.google.com/d/<wbr>msgid/chibolts/d58a6a70-470c-<wbr>4eec-9406-56a6daba19a1%<wbr>40googlegroups.com</a>.<br>
For more options, visit <a href="https://groups.google.com/d/optout" target="_blank" onmousedown="this.href='https://groups.google.com/d/optout';return true;" onclick="this.href='https://groups.google.com/d/optout';return true;">https://groups.google.com/d/<wbr>optout</a>.<br>
</blockquote></div><br></div></div></blockquote></div></div></div><div><br class="webkit-block-placeholder"></div>

-- <br>
You received this message because you are subscribed to the Google Groups "chibolts" group.<br>
To unsubscribe from this group and stop receiving emails from it, send an email to <a href="mailto:chibolts+unsubscribe@googlegroups.com">chibolts+unsubscribe@googlegroups.com</a>.<br>
To post to this group, send email to <a href="mailto:chibolts@googlegroups.com">chibolts@googlegroups.com</a>.<br>
To view this discussion on the web visit <a href="https://groups.google.com/d/msgid/chibolts/1b2381ae-3c32-4c01-9e49-47598bbb8191%40googlegroups.com?utm_medium=email&utm_source=footer">https://groups.google.com/d/msgid/chibolts/1b2381ae-3c32-4c01-9e49-47598bbb8191%40googlegroups.com</a>.<br>
For more options, visit <a href="https://groups.google.com/d/optout">https://groups.google.com/d/optout</a>.<br>
<span><tagsinEve&Valian.rtf></span></blockquote></div><br></div></body></html>

<p></p>

-- <br />
You received this message because you are subscribed to the Google Groups "chibolts" group.<br />
To unsubscribe from this group and stop receiving emails from it, send an email to <a href="mailto:chibolts+unsubscribe@googlegroups.com">chibolts+unsubscribe@googlegroups.com</a>.<br />
To post to this group, send email to <a href="mailto:chibolts@googlegroups.com">chibolts@googlegroups.com</a>.<br />
To view this discussion on the web visit <a href="https://groups.google.com/d/msgid/chibolts/82F3DF2B-2E53-4E6F-9F1B-CD6B9ACB2D62%40andrew.cmu.edu?utm_medium=email&utm_source=footer">https://groups.google.com/d/msgid/chibolts/82F3DF2B-2E53-4E6F-9F1B-CD6B9ACB2D62%40andrew.cmu.edu</a>.<br />
For more options, visit <a href="https://groups.google.com/d/optout">https://groups.google.com/d/optout</a>.<br />