<div dir="ltr">(Sorry, sent unfinished by mistake)<br>Thank you Leonid. Just to clarify: transforming this<br>*RAM:    Che~niko@1 che#felí(z)@4 con@2 mi@2 concubin-o@2 akue@1 , [^c]<br>    ha(s)ta@2 que@2 un@2 día@2 fatale@2 a#menda@1 hese@1 por@2<br>    liga-ite@4 , [^c] nunca@2 má@2 a#de(s)cansá@4 , [^c] ha(s)ta@2 <br>    que@2 a#heja@1 ichupe@1 [^c] .<br><br>into this<br><br>*RAM:    Che~niko@1 che#felí(z)@4 con@2 mi@2 concubin-o@2 akue@1 , [^c] +.<br>*RAM:    ha(s)ta@2 que@2 un@2 día@2 fatale@2 a#menda@1 hese@1 por@2<br>    liga-ite@4 , [^c] +.<br>*RAM     nunca@2 má@2 a#de(s)cansá@4 , [^c] +.<br>*RAM:    ha(s)ta@2<br>    que@2 a#heja@1 ichupe@1 [^c] .<br><br>would work, right? Now each tier contains only one clause. But this causes other problems, in that now you cannot do measures on utterances anymore, correct? There is no way for any program to see a transcription break +. and recognize that that tier's content in in the same utterance as something that follows...<br>Thanks<br>Bruno<br><br>On Tuesday, April 22, 2014 5:21:00 PM UTC-4, Bruno Estigarribia wrote:<blockquote class="gmail_quote" style="margin: 0;margin-left: 0.8ex;border-left: 1px #ccc solid;padding-left: 1ex;"><div dir="ltr">Hello everyone,<br><br>I have a code-switching transcript where we used [^c] as a clause delimiter when a line (=utterance) consisted of more than one clause.<br>We have also used @1 and @2 as word markers for each one of the two languages. And we have used @4 to mark mixed words. An example line follows (please ignore the morphological markings on the main tier for the moment--I've discussed this in a different thread and we intend to replace them with a proper MOR tier):<br><br>*RAM:    Che~niko@1 che#felí(z)@4 con@2 mi@2 concubin-o@2 akue@1 , [^c]<br>    ha(s)ta@2 que@2 un@2 día@2 fatale@2 a#menda@1 hese@1 por@2<br>    liga-ite@4 , [^c] nunca@2 má@2 a#de(s)cansá@4 , [^c] ha(s)ta@2 <br>    que@2 a#heja@1 ichupe@1 [^c] .<br><br>I want to find and count all mixed CLAUSES (intraclausal switching, excluding interclausal switching). The best I could come up with was this command:<br>combo +r5 +t* +s(*\@1^*^![\^c]^*^*\@2)+(*\@<wbr>2^*^![\^c]^*^*\@1)+(*\@4) +f<br><br>This outputs and retrieves all lines with any sort of mix, so for example the line above would be output once. We want to output each matched CLAUSE (so the line above would give actually 4 output matches, since all 4 clauses have some kind of mixing (note that this is not the same as outputting each match, since we collapse all matches obtained within a single clause--see the first clause in the example above).<br>I know that MLU has the +C option to work on clauses rather than utterances, but it is limited to MLU.<br>I assume I can transform all clauses into unique lines by using the transcription break terminator +. and use COMBO the normal way. But is there another (perhaps more elegant) solution?<br>Thank you<br>Bruno<br></div></blockquote></div>

<p></p>

-- <br />
You received this message because you are subscribed to the Google Groups "chibolts" group.<br />
To unsubscribe from this group and stop receiving emails from it, send an email to <a href="mailto:chibolts+unsubscribe@googlegroups.com">chibolts+unsubscribe@googlegroups.com</a>.<br />
To post to this group, send email to <a href="mailto:chibolts@googlegroups.com">chibolts@googlegroups.com</a>.<br />
To view this discussion on the web visit <a href="https://groups.google.com/d/msgid/chibolts/161bbc60-d2c9-41ed-a9b7-67cd838d2550%40googlegroups.com?utm_medium=email&utm_source=footer">https://groups.google.com/d/msgid/chibolts/161bbc60-d2c9-41ed-a9b7-67cd838d2550%40googlegroups.com</a>.<br />
For more options, visit <a href="https://groups.google.com/d/optout">https://groups.google.com/d/optout</a>.<br />