<html><head></head><body style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space; "><div>Dear Adam,</div><div><br></div><div>I don't know which datasets you need this for, but my colleague Jon Sprouse and I have annotated some of the American English child-directed speech datasets with Penn Treebank-like information as part of a larger project, which may make it easier to directly search for embedded clauses with tensed verbs.  For example, the annotation looks like the following:</div><div><br></div><div><br></div><div><div><div>(S1 (S (NP (PRP he))</div><div><br></div><div>     (VP (MD can)</div><div><br></div><div>      (NOT n't)</div><div><br></div><div>      (VP (VB write)</div><div><br></div><div>       (SBAR (WHADVP (WRB when)) (S (NP (PRP you)) (VP (VBP jump))))))</div><div><br></div><div>     (. .)))</div></div></div><div><br></div><div>"he can't write when you jump.", (from the Brown-Adam corpus) where "when you jump" would be an embedded tensed clause because it's in an SBAR and "jump" has the node label VBP, which indicates non-3rd singular present tense (as compared to VB, which would be the non-tensed version).</div><div><br></div><div>This derived corpus is available through the CHILDES database in the derived corpora section (<a href="http://childes.psy.cmu.edu/derived/">http://childes.psy.cmu.edu/derived/</a> ) and also at our university website (<a href="http://www.socsci.uci.edu/~lpearl/CoLaLab/TestingUG/childestreebank.html">http://www.socsci.uci.edu/~lpearl/CoLaLab/TestingUG/childestreebank.html</a> ).</div><div><br></div><div>A tool that's useful for automatically searching through these kind of annotated trees is the Stanford NLP Group's tool Tregex, which is freely available here:</div><div><a href="http://nlp.stanford.edu/software/tregex.shtml#Download">http://nlp.stanford.edu/software/tregex.shtml#Download</a></div><div><br></div><div>-Lisa</div><br><div><div>On Aug 24, 2012, at 6:53 AM, <a href="mailto:info-childes@googlegroups.com">info-childes@googlegroups.com</a> wrote:</div><br><blockquote type="cite">
  

  
  <a name="group_thread_1"></a>
  <div style="background-color: rgb(245, 245, 245); font-family: arial; border-top-width: 1px; border-top-style: solid; border-top-color: rgb(229, 229, 229); padding-top: 4px; padding-right: 0px; padding-bottom: 5px; padding-left: 32px; position: static; z-index: auto; "> <a target="_blank" href="http://groups.google.com/group/info-childes/t/770fc4da4075a73c" style="color:15c;text-decoration:none">Detecting Embedded Tensed Clauses</a> </div><ul>
 <br>
From:  Adam Goodkind <<a href="mailto:a.goodkind@gmail.com">a.goodkind@gmail.com</a>><br>
Reply-To:  <<a href="mailto:info-childes@googlegroups.com">info-childes@googlegroups.com</a>><br>
Date:  Thursday, August 23, 2012 8:42 AM<br>
To:  <<a href="mailto:info-childes@googlegroups.com">info-childes@googlegroups.com</a>><br>
Subject:  Detecting Embedded Tensed Clauses<br>
 <br>
Hi,<br>
 <br>
Using the various search protocols and meta-data levels, is it possible to<br>
detect embedded tensed clauses, i.e. embedded clauses with a tensed verb? I<br>
have been trying to create a combination of criteria, involving, e.g. CPRED,<br>
COMP, CJCT, CMOD, CPZR, etc., but with a low success rate.<br>
 <br>
Any and all help would be greatly appreciated.<br>
 <br>
Thanks,<br>
Adam<br>
 <br>
-- <br>
Adam Goodkind <br>
w  <a href="http://adamgoodkind.com">adamgoodkind.com</a> <<a href="http://www.adamgoodkind.com/">http://www.adamgoodkind.com/</a>><br>
t   @adamgreatkind <<a href="https://twitter.com/#!/adamgreatkind">https://twitter.com/#!/adamgreatkind</a>><br>
 <br>
-- <br></ul><div style="color:#555555; padding: 27px 0 0 40px">
 <br>
</div></blockquote></div><br></body></html>

<p></p>

-- <br />
You received this message because you are subscribed to the Google Groups "Info-CHILDES" group.<br />
To post to this group, send email to info-childes@googlegroups.com.<br />
To unsubscribe from this group, send email to info-childes+unsubscribe@googlegroups.com.<br />
For more options, visit <a href="https://groups.google.com/groups/opt_out">https://groups.google.com/groups/opt_out</a>.<br />
 <br />
 <br />