<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN">
<HTML><HEAD><TITLE>Re: Question about word tokens and new words on CLAN</TITLE>
<META http-equiv=Content-Type content="text/html; charset=us-ascii">
<META content="MSHTML 6.00.6000.16414" name=GENERATOR></HEAD>
<BODY>
<DIV dir=ltr align=left><BR> </DIV>
<DIV></DIV>
<DIV dir=ltr align=left><SPAN class=169381619-28052009><FONT face=Arial 
color=#808000>Leonid,</FONT></SPAN></DIV>
<DIV dir=ltr align=left><SPAN class=169381619-28052009><FONT face=Arial 
color=#808000></FONT></SPAN> </DIV>
<DIV dir=ltr align=left><SPAN class=169381619-28052009><FONT face=Arial 
color=#808000>Could it be simply that the input from the command is so great 
that the first part is lost due to space limitations?  I have had that 
happen with large data sets, but I don't know whether that still happens.  
The entire set of results appears, but the earliest ones disappear at some point 
as more results are added to the end.</FONT></SPAN></DIV>
<DIV dir=ltr align=left><SPAN class=169381619-28052009><FONT face=Arial 
color=#808000></FONT></SPAN> </DIV>
<DIV dir=ltr align=left><SPAN class=169381619-28052009><FONT face=Arial 
color=#808000>--Phyllis Schneider</FONT></SPAN></DIV><BR>
<DIV class=OutlookMessageHeader lang=en-us dir=ltr align=left>
<HR tabIndex=-1>
<FONT face=Tahoma size=2><B>From:</B> info-childes@googlegroups.com 
[mailto:info-childes@googlegroups.com] <B>On Behalf Of </B>Leonid 
Spektor<BR><B>Sent:</B> Thursday, May 28, 2009 11:43 AM<BR><B>To:</B> 
info-childes@googlegroups.com; chibolts@googlegroups.com<BR><B>Subject:</B> Re: 
Question about word tokens and new words on CLAN<BR></FONT><BR></DIV>
<DIV></DIV><FONT face="Lucida Grande"><SPAN 
style="FONT-SIZE: 11pt">Carolyn,<BR><BR>    The proper place 
to post this kind of question is on <FONT color=#0000ff><U><A 
href="chibolts@googlegroups.com">chibolts@googlegroups.com</A>.</U></FONT> I am 
posting a reply to both chibolts and info-childes address in case you do not 
subscribe to chibolts Google Group yet.<BR><BR>    There is 
no database size limit set in CLAN except for the memory size on your computer. 
Freq command should be able to count all words in database. The problem might be 
the format of email messages in CLAN system or the commands and options you use. 
Also, please make sure that you have the latest version of CLAN. To diagnose the 
problems you are describing it would be very helpful to me if you could email me 
a sample of your data and the command line you are using at <A 
href="spektor@andrew.cmu.edu">spektor@andrew.cmu.edu</A>. If you are not 
comfortable to email to me any sample of your data, then please just describe it 
and exactly what kind of analyzes you are trying run conduct. Is your data in 
just a plain text format or is it in fully legal CHAT format? If you are trying 
to simply get a frequency count of all words you can use "freq +y *.cha" 
command. That is assuming that your data file(s) have ".cha" extension. If you 
are trying to get just count of words associated with a particular speaker and 
your data is in legal CHAT format, then you can add "+t*CHI" option to above 
command. The "*CHI" refers to a speaker name in your data files.<BR><BR>Hope 
this help,<BR>Leonid.<BR><BR><BR>On 28-05-09 10:22, "Carolyn Piazza" <<A 
href="carolynpiazza@gmail.com">carolynpiazza@gmail.com</A>> 
wrote:<BR><BR></SPAN></FONT>
<BLOCKQUOTE><FONT face="Lucida Grande"><SPAN style="FONT-SIZE: 11pt">To the 
  info-childes google group,<BR> <BR>   I'm not sure if this is 
  the place to send questions, but if it is not, perhaps someone can point me to 
  the right place.  <BR>   I am working on data based on email 
  messages and have placed some 366 emails into the CLAN system.  When I 
  run a frequency count, the outcome is words beginning with the letters O to 
  Z.  The words beginning with A-N are missing.  Is there a certain 
  data base size in which the program will not accurately process?  Thanks, 
  in advance, to whomever can answer this.<BR> <BR>Best regards,<BR>Carolyn 
  Piazza<BR><A 
  href="cpiazza@fsu.edu">cpiazza@fsu.edu</A><BR><BR><BR><BR></SPAN></FONT></BLOCKQUOTE><BR<br>
--~--~---------~--~----~------------~-------~--~----~<br>
You received this message because you are subscribed to the Google Groups "Info-CHILDES" group. <br> To post to this group, send email to info-childes@googlegroups.com <br> To unsubscribe from this group, send email to info-childes+unsubscribe@googlegroups.com <br> For more options, visit this group at http://groups.google.com/group/info-childes?hl=en<br>
-~----------~----~----~----~------~----~------~--~---<br>
<br>