<div dir="ltr" style="caret-color: rgb(34, 34, 34); color: rgb(34, 34, 34); font-family: Arial, Helvetica, sans-serif;"><font size="2">Hi everyone, <br /><br />I have a question about extracting participants' utterances using CLAN commands and was wondering if I'm thinking along the right lines. I'd appreciate it if you could take a look. Thanks!<br /><br />I'm working with DementiaBank, specifically the ADReSS dataset, a subset of the Pitt corpus. I used the following command to extract the 'flow' tier of participants' utterances: `<font face="monospace">flo +cr +tPAR*</font>`. Here, I have the asterisk * placed after the PAR identifier. But I noticed that in the CLAN manual, the asterisk typically precedes it, as in `<font face="monospace">t*PAR</font>`. <br /><br />I got the following output after running `<font face="monospace">t*PAR</font>`</font></div><div dir="ltr" style="caret-color: rgb(34, 34, 34); color: rgb(34, 34, 34); font-family: Arial, Helvetica, sans-serif;"><font size="2"><br /></font></div><div dir="ltr" style="caret-color: rgb(34, 34, 34); color: rgb(34, 34, 34); font-family: Arial, Helvetica, sans-serif;"><font size="2"><font face="monospace">flo (13-Apr-2023) is conducting analyses on:<br />  ONLY speaker main tiers matching: *PAR;</font><br /></font></div><div dir="ltr" style="caret-color: rgb(34, 34, 34); color: rgb(34, 34, 34); font-family: Arial, Helvetica, sans-serif;"><font size="2"><br /></font></div><div style="caret-color: rgb(34, 34, 34); color: rgb(34, 34, 34); font-family: Arial, Helvetica, sans-serif;"><font size="2">And here's the output after running `<font face="monospace">tPAR*</font>`</font></div><div dir="ltr" style="caret-color: rgb(34, 34, 34); color: rgb(34, 34, 34); font-family: Arial, Helvetica, sans-serif;"><font size="2"><br /></font></div><div dir="ltr" style="caret-color: rgb(34, 34, 34); color: rgb(34, 34, 34); font-family: Arial, Helvetica, sans-serif;"><font size="2"><font face="monospace">flo (13-Apr-2023) is conducting analyses on:<br />  ONLY speaker main tiers matching: *PAR*;</font><br /></font></div><div dir="ltr" style="caret-color: rgb(34, 34, 34); color: rgb(34, 34, 34); font-family: Arial, Helvetica, sans-serif;"><font size="2"><br /></font></div><div dir="ltr" style="caret-color: rgb(34, 34, 34); color: rgb(34, 34, 34); font-family: Arial, Helvetica, sans-serif;"><font size="2">It looks like the asterisk is used to search for tier ID patterns. Since all my files contain only INV and PAR tiers, I assume tier matching would only affect the selection of the PAR tier. I also used a Python function to verify that the utterances extracted by these two commands were identical (attached below, in case it's helpful). </font></div><div dir="ltr" style="caret-color: rgb(34, 34, 34); color: rgb(34, 34, 34); font-family: Arial, Helvetica, sans-serif;"><font size="2"><br /></font></div><div dir="ltr" style="caret-color: rgb(34, 34, 34); color: rgb(34, 34, 34); font-family: Arial, Helvetica, sans-serif;"><font size="2">Both commands appear to work, but I don't fully understand why. Please let me know your thoughts. Thank you very much!</font></div><div dir="ltr" style="caret-color: rgb(34, 34, 34); color: rgb(34, 34, 34); font-family: Arial, Helvetica, sans-serif;"><font size="2"><br /></font></div><div dir="ltr" style="caret-color: rgb(34, 34, 34); color: rgb(34, 34, 34); font-family: Arial, Helvetica, sans-serif;"><font size="2">Best,</font></div><div dir="ltr" style="caret-color: rgb(34, 34, 34); color: rgb(34, 34, 34); font-family: Arial, Helvetica, sans-serif;"><font size="2">Mingyu</font></div><div dir="ltr" style="caret-color: rgb(34, 34, 34); color: rgb(34, 34, 34); font-family: Arial, Helvetica, sans-serif;"><font size="2"><br /></font></div><div dir="ltr" style="caret-color: rgb(34, 34, 34); color: rgb(34, 34, 34); font-family: Arial, Helvetica, sans-serif;"><div><font face="monospace" size="2">def check_clan_command(id, file_old, file_new):</font></div><div><font face="monospace" size="2">    # Read the .cex file created by the old command (i.e. with tPAR*)<br />    with open(PATH_TO_OLD_FILE, 'r') as file_old_cmd:<br />        file_o = file_old_cmd.read().splitlines()</font></div><div><font face="monospace" size="2">    # Read the .cex file created by the new command (i.e. with t*PAR)<br />    with open(</font><span style="font-family: monospace; font-size: small;">PATH_TO_NEW_FILE</span><font face="monospace" size="2">, 'r') as file_new_cmd:<br />        file_n = file_new_cmd.read().splitlines()</font></div><div><font face="monospace" size="2">    print(id, file_o == file_n)</font></div></div><div dir="ltr" style="caret-color: rgb(34, 34, 34); color: rgb(34, 34, 34); font-family: Arial, Helvetica, sans-serif;"><div><div><br /></div></div></div>

<p></p>

-- <br />
You received this message because you are subscribed to the Google Groups "chibolts" group.<br />
To unsubscribe from this group and stop receiving emails from it, send an email to <a href="mailto:chibolts+unsubscribe@googlegroups.com">chibolts+unsubscribe@googlegroups.com</a>.<br />
To view this discussion visit <a href="https://groups.google.com/d/msgid/chibolts/d2459e0d-41c6-4707-9e00-e75f5e755c47n%40googlegroups.com?utm_medium=email&utm_source=footer">https://groups.google.com/d/msgid/chibolts/d2459e0d-41c6-4707-9e00-e75f5e755c47n%40googlegroups.com</a>.<br />