<html>
  <head>
    <meta content="text/html; charset=ISO-8859-1"
      http-equiv="Content-Type">
  </head>
  <body bgcolor="#FFFFFF" text="#000000">
    For what it's worth, the following link gives what I imagine to be
    an upper bound on a non-native speaker's oral ambiguity measure in
    just about any language :)<br>
    <br>
    A story in which each syllable is pronounced /shi/<br>
    <br>
<a class="moz-txt-link-freetext" href="http://books.google.fr/books?id=vu3lRLVUta8C&pg=PA30&lpg=PA30&dq=a+story+in+which+each+syllable+is+pronounced+shi&source=bl&ots=htFQwMsQuR&sig=_NQkI_j64m9QAPJsuD-8rEmsx7o&hl=en&sa=X&ei=sG8qT-GxIs6h-QbHvcz4DQ&sqi=2&redir_esc=y#v=onepage&q=a%20story%20in%20which%20each%20syllable%20is%20pronounced%20shi&f=false">http://books.google.fr/books?id=vu3lRLVUta8C&pg=PA30&lpg=PA30&dq=a+story+in+which+each+syllable+is+pronounced+shi&source=bl&ots=htFQwMsQuR&sig=_NQkI_j64m9QAPJsuD-8rEmsx7o&hl=en&sa=X&ei=sG8qT-GxIs6h-QbHvcz4DQ&sqi=2&redir_esc=y#v=onepage&q=a%20story%20in%20which%20each%20syllable%20is%20pronounced%20shi&f=false</a><br>
    <br>
    Best regards,<br>
    Assaf<span id="spBody" class="Forum_Normal"><font size="4"><br>
      </font></span><br>
    On 02/02/2012 11:25, Karen Fort wrote:
    <blockquote cite="mid:4F2A648E.2010103@inist.fr" type="cite">Hi all,
      <br>
      <br>
      I could not find the time to precise my question and then received
      a lot of very interesting answers and references.
      <br>
      Thank you all for this!
      <br>
      <br>
      In fact, I should have said that I'm looking for the number of
      ambiguous word tokens in terms of POS in an English corpus, for
      example from the Penn TreeBank. One solution would be to compute
      this myself from the Brown corpus, but I was curious if there was
      a ref. on this.
      <br>
      <br>
      I found this ref for French that says 60% of the French tokens in
      their corpus were non ambiguous in terms of POS:
      <br>
      Tzoukermann, E.; Radev, D. R. & Gale, W. A. Ken Church, Susan
      Armstrong, P. I. E. T. & Yarowsky, D. (ed.) Natural Language
      Processing Using Very Large Corpora Tagging french without lexical
      probabilities -- combining linguistic knowledge and statistical
      learning Kluwer Academic, 1999
      <br>
      <br>
      Of course, it all depends on the number of tags, their refinement
      et so on. It only gives a very rough idea and should be taken in
      its context, obviously. But that's all I need.
      <br>
      <br>
      Best,
      <br>
      <br>
      Karen
      <br>
      <br>
      <br>
      Le 26/01/2012 10:39, Eckhard Bick a écrit :
      <br>
      <blockquote type="cite">Hello again,
        <br>
        <br>
        I forgot to add, that the ambiguous word tokens in my English
        test run
        <br>
        amounted to 49.8%.
        <br>
        <br>
        Best,
        <br>
        Eckhard
        <br>
        <br>
        On 2012-01-25 20:33, FORT, Karen wrote:
        <br>
        <blockquote type="cite">Hi all,
          <br>
          <br>
          I need to find this information (the proportion of ambiguous
          words in English and their frequency).
          <br>
          For example, we know that in French 8% of the words represent
          30% of the ambiguity.
          <br>
          Of course, it's very rough, but it's only to have a rough
          idea.
          <br>
          <br>
          Can somebody help me with this (of course, I searched for a
          ref but could not find anything precise)?
          <br>
          <br>
          Thank you in advance,
          <br>
          <br>
          Regards,
          <br>
          <br>
          <br>
          Karën FORT
          <br>
          Ingénieure/Engineer et/and doctorante/PhD student
          <br>
          INIST-CNRS / LIPN
          <br>
          2, allée de Brabois
          <br>
          54500 Vandoeuvre-lès-Nancy
          <br>
          France
          <br>
          Bureau/Office: H112
          <br>
          +33 (0)3 83 50 46 36
          <br>
          <br>
          <a class="moz-txt-link-freetext" href="http://www-lipn.univ-paris13.fr/~fort/">http://www-lipn.univ-paris13.fr/~fort/</a>
          <br>
          _______________________________________________
          <br>
          UNSUBSCRIBE from this page:
          <a class="moz-txt-link-freetext" href="http://mailman.uib.no/options/corpora">http://mailman.uib.no/options/corpora</a>
          <br>
          Corpora mailing list
          <br>
          <a class="moz-txt-link-abbreviated" href="mailto:Corpora@uib.no">Corpora@uib.no</a>
          <br>
          <a class="moz-txt-link-freetext" href="http://mailman.uib.no/listinfo/corpora">http://mailman.uib.no/listinfo/corpora</a>
          <br>
          <br>
        </blockquote>
        <br>
        <br>
      </blockquote>
      <br>
    </blockquote>
  </body>
</html>