On 7/31/07, <b class="gmail_sendername">Oliver Mason</b> <<a href="mailto:O.Mason@bham.ac.uk">O.Mason@bham.ac.uk</a>> wrote:<div><span class="gmail_quote"></span><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
> And the goal is good, because we all do it, every day.<br><br>I would say the goal is pointless.</blockquote><div><br>The goal of "<span class="q">generating all and only the grammatical sentences of a language"?
<br><br></span>Well I would agree that the goal of getting them all becomes poorly defined in the limit. But I would like to know how I can produce as many as I like, and most of them fairly "grammatical" by common consensus.
<br></div><br><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">  Language is not a fixed formal<br>mechanism, it's a dynamic and evolving system.  I'm guessing here, but
<br>I'm pretty sure nobody in biology would care about listing all the<br>possible shapes in which a tree can grow.  So it's not a problem that<br>is relevant to understanding how language works.  Furthermore,<br>
language is constantly changing, so as soon as you've created a<br>grammar than can generate all those sentence it's already out of date.<br> A bit like counting the exact population of our planet.<br><br>However, other people might disagree, and it depends very much on what
<br>you're looking for when analysing language.  I would argue that you<br>need a corpus to get a decent grammar, by which I mean one that<br>describes actual usage and hence allows you to make relevance<br>judgments.  If a grammar describes an obscure phenomenon in great
<br>detail but neglects more common structures, then it's not that useful.<br> And human intuition is good at neglecting routine usage in favour of<br>'interesting' and 'weird' things.<br><br>Also, corpora are not irreducibly complex.  We just haven't found the
<br>right way forwards, as we're too focused on formal methods and<br>traditional grammar.  And I blame Chomsky for that, boo hiss.</blockquote><div><br>You've set up a couple of straw men for me here. I'm not arguing that language is a "fixed formal system "at all.
<br><br>Chomsky advocated a fixed formal system, sure. But that was not what made him distinct. Not originally.<br><br>What made Chomsky distinct was his observation that if a fixed formal system exists, it _cannot_ be seen in the data. (Leading him to the conclusion it must be innate.)
<br><br>By all means reject a fixed formal system. I think this is indeed how Chomsky should have interpreted his observations.<br><br>But then this also means that corpora are irreducible (otherwise you can get a fixed formal system, by definition.)
<br><br>This is the point I wish us to see. We are missing it.<br><br>Corpus linguists shouldn't have a problem with this. And the machine learning guys here shouldn't worry about it either. Once we give up the goal of reduction of corpora it opens up new worlds of descriptive power for them.
<br></div><br><div><span class="q">-Rob</span></div></div>