<div dir="ltr">Hi Brian, <div><br></div><div>Yes! What we've done follows the 16.1 conventions using precedes for whole utterances and @s for the single words for intra-utterance switching (e.g., @s:yue, @s:spa for Cantonese or Spanish, respectively). Would Batchalign be able to recognize these codes? </div><div><br></div><div>Thanks!</div><div>Janet</div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Thu, May 23, 2024 at 7:17 AM Brian Macwhinney <<a href="mailto:macw@andrew.cmu.edu">macw@andrew.cmu.edu</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">Janet,<br>
<br>
It seems that I didn’t understand your question.  If you are talking about tagging using the UD taggers used by Batchalign, then I believe this is possible, but Houjun will need to confirm.  However, you would have to mark each utterance in a CHAT file with the language tag if it were not the primary language of the file.  Please take a look at section 16.1 of the CHAT manual about that type of coding.<br>
<br>
—Brian<br>
<br>
> On May 23, 2024, at 1:54 AM, Janet Bang <<a href="mailto:janet.bang@gmail.com" target="_blank">janet.bang@gmail.com</a>> wrote:<br>
> <br>
> Hi Brian,<br>
> <br>
> Thanks for the quick response. We are still in the world of transcripts but I definitely look forward to the day when we can have multilingual ASR!<br>
> <br>
> Since Houjun mentioned that intra utterance code switching wasn’t yet available, would you recommend that we first run batch align and then do the code switched utterances by hand? We don’t have many for now and were still working out some processes, but thinking of what we could build up moving forward.<br>
> <br>
> Janet<br>
> <br>
> On Wednesday 22 May 2024, Brian Macwhinney <<a href="mailto:macw@andrew.cmu.edu" target="_blank">macw@andrew.cmu.edu</a>> wrote:<br>
> Dear Janet,<br>
>     Not yet, I am afraid.  As my colleague Houjun Liu puts it “code-switching multilingual ASR is still an active and unstable area of research”. <br>
> <br>
> — Brian MacWhinney<br>
> <br>
> > On May 22, 2024, at 6:28 PM, Janet Bang <<a href="mailto:janet.bang@gmail.com" target="_blank">janet.bang@gmail.com</a>> wrote:<br>
> > <br>
> > Hello, <br>
> > <br>
> > I am currently working with transcripts that are multilingual (e.g., English/Spanish, English/Korean). They are around 70 - 100 utterances or so of parent-reported first words/phrases for children between 12 - 26 months, so they are around 1 - 3 words per utterance, but occasionally longer. We have asked parents to report what their child said across multiple days, in whichever language they used. <br>
> > <br>
> > We would like to extract lemmas and consider unilemmas (e.g., Mommy, Mamá - Spanish, 어마 - Korean) both across children who speak different languages and within a child who might use multiple languages. To facilitate this I was wondering if batchalign would work with multilingual transcripts? <br>
> > <br>
> > Thank you!<br>
> > Janet<br>
> > <br>
> > -- <br>
> > You received this message because you are subscribed to the Google Groups "chibolts" group.<br>
> > To unsubscribe from this group and stop receiving emails from it, send an email to <a href="mailto:chibolts%2Bunsubscribe@googlegroups.com" target="_blank">chibolts+unsubscribe@googlegroups.com</a>.<br>
> > To view this discussion on the web visit <a href="https://groups.google.com/d/msgid/chibolts/CAC5V4hg5uf152so6ALFk9RyNR_aX6uFb0jEsbH7yYKs2utHD2A%40mail.gmail.com" rel="noreferrer" target="_blank">https://groups.google.com/d/msgid/chibolts/CAC5V4hg5uf152so6ALFk9RyNR_aX6uFb0jEsbH7yYKs2utHD2A%40mail.gmail.com</a>.<br>
> <br>
<br>
</blockquote></div>

<p></p>

-- <br />
You received this message because you are subscribed to the Google Groups "chibolts" group.<br />
To unsubscribe from this group and stop receiving emails from it, send an email to <a href="mailto:chibolts+unsubscribe@googlegroups.com">chibolts+unsubscribe@googlegroups.com</a>.<br />
To view this discussion on the web visit <a href="https://groups.google.com/d/msgid/chibolts/CAC5V4hjkKpAmzGhzwnW%3D%2BEY5bz6LwrZaGkFW-Fe69o17erdT9w%40mail.gmail.com?utm_medium=email&utm_source=footer">https://groups.google.com/d/msgid/chibolts/CAC5V4hjkKpAmzGhzwnW%3D%2BEY5bz6LwrZaGkFW-Fe69o17erdT9w%40mail.gmail.com</a>.<br />