<div>Hi, all,</div>
<div> </div>
<div>Angus's point is well-taken. Although I haven't done much research on this particular point, there are clear indications (eg, I once wrote an assembly-lg. program for syllabifying written Spanish with virtually 100% coverage using only 310 bytes [no Ks or other prefixes!]) that for Spanish the differences between written language and the (automatically derived) spoken language are less striking than in the case of English and (I assume) German, and very well might produce reasonably accurate statistics. That is, Spanish orthography, despite the very real (though relatively minor) problems which it does have and which I won't go into here, is relatively more 'phonemic' with respect to the spoken language than (at least) English is. (This, I believe, would be true for the majority of major dialects of Spanish, ie, at least Mexican Spanish and 'Academic' European Spanish, as well as other major American dialects ('cultured' Colombian and Venezuelan, for example -- I'm not so sure about 'Caribbean' varieties).)</div>

<div> </div>
<div>Jim<br><br></div>
<div class="gmail_quote">On Tue, Dec 15, 2009 at 8:26 AM, Angus B. Grieve-Smith <span dir="ltr"><<a href="mailto:grvsmth@panix.com">grvsmth@panix.com</a>></span> wrote:<br>
<blockquote style="BORDER-LEFT: #ccc 1px solid; MARGIN: 0px 0px 0px 0.8ex; PADDING-LEFT: 1ex" class="gmail_quote">
<div class="im"><br>
<blockquote style="BORDER-LEFT: #ccc 1px solid; MARGIN: 0px 0px 0px 0.8ex; PADDING-LEFT: 1ex" class="gmail_quote">Another solution might be to apply a grapheme-to-phoneme converter (as used in<br>text-to-speech synthesis systems) to your own corpus - written sources or<br>
transcribed speech - and compute the phoneme frequencies from this converted<br>corpus.<br></blockquote></div>  I would like to point out that this will not give you actual phoneme frequency, only an estimate of what the frequencies would be if every word were pronounced according to the standards encoded in the grapheme-to-phoneme converter.<br>
<font color="#888888"><br>-- <br>                               -Angus B. Grieve-Smith<br>                               <a href="mailto:grvsmth@panix.com" target="_blank">grvsmth@panix.com</a></font> 
<div>
<div></div>
<div class="h5"><br><br><br>_______________________________________________<br>Corpora mailing list<br><a href="mailto:Corpora@uib.no" target="_blank">Corpora@uib.no</a><br><a href="http://mailman.uib.no/listinfo/corpora" target="_blank">http://mailman.uib.no/listinfo/corpora</a><br>
</div></div></blockquote></div><br><br clear="all"><br>-- <br>James L. Fidelholtz<br>Posgrado en Ciencias del Lenguaje<br>Instituto de Ciencias Sociales y Humanidades<br>Benemérita Universidad Autónoma de Puebla, MÉXICO<br>