<html><head><meta http-equiv="Content-Type" content="text/html; charset=us-ascii"></head><body style="word-wrap: break-word; -webkit-nbsp-mode: space; line-break: after-white-space;" class="">Dear Simge,<div class="">    I'm not sure that I fully understand your criteria for excluding utterances with repeated words.  For example, what if a common word like "the" or "of" is used in both utterances?  Do you then really want to exclude the second one?  There is a program called CHIP that carefully analyzes th overlap between sentences in terms of repeated words, but it might not do exactly what you want.  </div><div class="">    I am curious why you think it is important to conduct these different types of exclusions.  What exactly are you looking for?  What hypothesis might you be testing?</div><div class=""><br class=""></div><div class="">-- Brian MacWhinney</div><div class=""><div><br class=""><blockquote type="cite" class=""><div class="">On Apr 9, 2019, at 8:38 PM, <a href="mailto:sit591@g.harvard.edu" class="">sit591@g.harvard.edu</a> wrote:</div><br class="Apple-interchange-newline"><div class=""><div dir="ltr" class="">Hi Prof. MacWhinney,<div class=""><br class=""></div><div class="">Thanks for your reply! Well, I guess it will take me a while to do this.</div><div class=""><br class=""></div><div class="">I have another question regarding the same study. Right now, I am using the code <b class="">kwal +sX -w10 +w5 -t*CHI, </b>where X is meant to be a placeholder for the words that I am interested in searching in the input. Ideally, however, I would prefer selecting a stretch of talk like this only if the target utterance that contains the word X does not constitute a repetition of the immediately preceding line (e.g., the parent only uses X because another speaker said X in the immediately preceding line). My question is pretty much the same as above: is there a practical way to exclude repetitive utterances of this sort?</div><div class=""><br class=""></div><div class="">Thank you so much!</div><div class=""><br class=""></div><div class="">Simge</div><div class=""><br class=""></div><div class=""><br class=""><br class="">On Monday, April 8, 2019 at 5:00:42 PM UTC-4, sit...@<a href="http://g.harvard.edu" class="">g.harvard.edu</a> wrote:<blockquote class="gmail_quote" style="margin: 0;margin-left: 0.8ex;border-left: 1px #ccc solid;padding-left: 1ex;"><div dir="ltr" class="">Hi all,<div class=""><br class=""></div><div class="">I am doing a corpus study using the Providence corpus right now. For the purposes of this study, I am interested in analyzing only the utterances that are produced by the speakers during their natural conversational exchanges, but the corpus also includes many stretches of talk that consist of the stories that parents read to the children, or songs and nursery rhymes they sing, etc. Is there a practical way to weed out these parts from the corpus or do I have to face the gargantuan task of eliminating them manually?</div><div class=""><br class=""></div><div class="">Thanks in advance for your help!</div><div class=""><br class=""></div><div class="">Simge Topaloglu</div><div class=""><br class=""></div></div></blockquote></div></div><div class=""><br class="webkit-block-placeholder"></div>

-- <br class="">
You received this message because you are subscribed to the Google Groups "chibolts" group.<br class="">
To unsubscribe from this group and stop receiving emails from it, send an email to <a href="mailto:chibolts+unsubscribe@googlegroups.com" class="">chibolts+unsubscribe@googlegroups.com</a>.<br class="">
To post to this group, send email to <a href="mailto:chibolts@googlegroups.com" class="">chibolts@googlegroups.com</a>.<br class="">
To view this discussion on the web visit <a href="https://groups.google.com/d/msgid/chibolts/53006962-d369-49f6-9e9e-809ca73708b5%40googlegroups.com?utm_medium=email&utm_source=footer" class="">https://groups.google.com/d/msgid/chibolts/53006962-d369-49f6-9e9e-809ca73708b5%40googlegroups.com</a>.<br class="">
For more options, visit <a href="https://groups.google.com/d/optout" class="">https://groups.google.com/d/optout</a>.<br class="">
</div></blockquote></div><br class=""></div></body></html>

<p></p>

-- <br />
You received this message because you are subscribed to the Google Groups "chibolts" group.<br />
To unsubscribe from this group and stop receiving emails from it, send an email to <a href="mailto:chibolts+unsubscribe@googlegroups.com">chibolts+unsubscribe@googlegroups.com</a>.<br />
To post to this group, send email to <a href="mailto:chibolts@googlegroups.com">chibolts@googlegroups.com</a>.<br />
To view this discussion on the web visit <a href="https://groups.google.com/d/msgid/chibolts/7DC7A463-29C5-4F87-9E82-22C907F3E2EF%40andrew.cmu.edu?utm_medium=email&utm_source=footer">https://groups.google.com/d/msgid/chibolts/7DC7A463-29C5-4F87-9E82-22C907F3E2EF%40andrew.cmu.edu</a>.<br />
For more options, visit <a href="https://groups.google.com/d/optout">https://groups.google.com/d/optout</a>.<br />