<div>All,</div><div><br></div><div>Ken says:</div><div>> It would be nice if we could apply John's rules to Ted's compounds and <b>put those findings into a dictionary</b> </div><div>> (lexicographers have only barely done so, while lexicologists need that information).</div>

<div><br></div>Good news is, Dante (<a href="http://webdante.com">http://webdante.com</a>) has done something very like this in a v large exercise on corpus-driven lexicography for English.  It contains 20,844 compounds, all identified automatically and confirmed and classified by lexicographers.  Of these, 2,989 have more than one meaning.<div>

<br></div><div>Distribution arrangement is being finalised: it will very soon (by end Feb) be available free for academic research (and for low prices for non-academic research) .  At <a href="http://webdante.com">webdante.com</a> you can already explore all words in the M-R stretch of the alphabet.<br>

<div><br></div><div>Thank you to Justin for Pen Island and Powergen Italia (juvenile that I am)!<br><br></div><div>Adam</div><div><br><div>
<div class="gmail_quote">On 28 January 2011 20:02, Ken Litkowski <span dir="ltr"><<a href="mailto:ken@clres.com" target="_blank">ken@clres.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">




  
    
  
  <div bgcolor="#ffffff" text="#000000">
    On 1/28/2011 1:04 PM, Ted Pedersen wrote:
    <blockquote type="cite">
      <pre>What a fun thread. :)
</pre>
    </blockquote>
    <br>
    One part alchemy and one part science. Since I kinda kicked off this
    thread with my concern about us not looking for primitives, I'd like
    to add a few further cents and a lament.<br>
    <br>
    PBS newshour did a piece on Google's n-grams a few weeks ago ("Word
    Nerding Just Got Easier") with the ever delightful Erin McKean. This
    thread has partially followed that notion with all the humorous noun
    compounds. I hope we don't focus on those so much, except as needed
    to do crossword puzzles.<br>
    <br>
    Yorick expressed his long experience with an apparent lack of
    progress. Certainly, Robert has clear scientific goals in mind and
    we have gotten some nice "scientific" observations, particularly
    from John, Ramesh, Anne-Kathrin, and Ted. It would be nice if we
    could get some community-wide effort into this. We need a vehicle,
    perhaps transforming Wiktionary. It would be nice if we could apply
    John's rules to Ted's compounds and <b>put those findings into a
      dictionary</b> (lexicographers have only barely done so, while
    lexicologists need that information).<br>
    <br>
        Ken<br>
    <pre cols="72">-- 
Ken Litkowski                     TEL.: 301-482-0237
CL Research                       EMAIL: <a href="mailto:ken@clres.com" target="_blank">ken@clres.com</a>
9208 Gue Road                     Home Page: <a href="http://www.clres.com" target="_blank">http://www.clres.com</a>
Damascus, MD 20872-1025 USA       Blog: <a href="http://www.clres.com/blog" target="_blank">http://www.clres.com/blog</a>
</pre>
  </div>

<br>_______________________________________________<br>
Corpora mailing list<br>
<a href="mailto:Corpora@uib.no" target="_blank">Corpora@uib.no</a><br>
<a href="http://mailman.uib.no/listinfo/corpora" target="_blank">http://mailman.uib.no/listinfo/corpora</a><br>
<br></blockquote></div><br><br clear="all"><br>-- <br>========================================<br><a href="http://www.kilgarriff.co.uk/" target="_blank">Adam Kilgarriff</a>                  <a href="mailto:adam@lexmasterclass.com" target="_blank">adam@lexmasterclass.com</a>                                             <br>


Director                                    <a href="http://www.sketchengine.co.uk/" target="_blank">Lexical Computing Ltd</a>                <br>Visiting Research Fellow                 <a href="http://leeds.ac.uk" target="_blank">University of Leeds</a>     <div>


<i><font color="#006600">Corpora for all</font></i> with <a href="http://www.sketchengine.co.uk" target="_blank">the Sketch Engine</a>                 </div><div>                        <i><a href="http://www.webdante.com" target="_blank">DANTE: <font color="#009900">a lexical database for English</font></a><font color="#009900"> </font>                 </i><div>


========================================</div></div><br>
</div>
</div></div>