<html><head></head><body style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space; ">dear all,<div>actually if you add an external lexicon to morfette, it will greatly improve the unkwown word accuracy.</div><div><br></div><div>Best,</div><div>Djamé</div><div><br></div><div><br><div><div>Le 22 août 2014 à 11:29, Yannick Versley a écrit :</div><br class="Apple-interchange-newline"><blockquote type="cite"><div dir="ltr">Dear Matías,<div><br></div><div>have you looked at Morfette</div><div><a href="https://sites.google.com/site/morfetteweb/home">https://sites.google.com/site/morfetteweb/home</a></div><div>it works quite well for data-driven lemmatization.</div>
<div><br></div><div>The lemmatizer from the mate-tools</div><div><a href="https://code.google.com/p/mate-tools/">https://code.google.com/p/mate-tools/</a><br></div><div>could also work for you.</div><div><br></div><div>(Both of these tools need a corpus but not a dictionary; If you have a dictionary but no corpus,</div>
<div>you could try something like Morfessor, or try to induce a morphology lexicon from Wiktionary)</div><div><br></div><div>Best wishes,</div><div>Yannick</div></div><div class="gmail_extra"><br><br><div class="gmail_quote">
On Fri, Aug 22, 2014 at 11:12 AM, Matías Guzmán Naranjo <span dir="ltr"><<a href="mailto:mortem.dei@gmail.com" target="_blank">mortem.dei@gmail.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<div dir="ltr">Dear all,<br><br><div><div><p>I need a 
language agnostic stemmer that can handle concatenative morphology for 
non polysinthetic langauges. Is there anything like that? Only thing I 
could find was a patent but it looked fishy and I didn't see any demo of
 an implementation.</p><p>I basically need to match inflected words in a natural text to a base
 form in a dictionary, so I had also thought of going the other way 
around, removing first regular morphemes (things like infinitive markers
 or nominative declension markers or whatever) from the dictionary 
entries and then trying to find for each word in the corpus the closet 
matched in the stemmed entries. I really don't know if anyone has tried 
this and how well (or poorly) it performs. Does anyone know?</p><p>Thanks!</p>
</div>
</div><br></div>
<br>_______________________________________________<br>
UNSUBSCRIBE from this page: <a href="http://mailman.uib.no/options/corpora" target="_blank">http://mailman.uib.no/options/corpora</a><br>
Corpora mailing list<br>
<a href="mailto:Corpora@uib.no">Corpora@uib.no</a><br>
<a href="http://mailman.uib.no/listinfo/corpora" target="_blank">http://mailman.uib.no/listinfo/corpora</a><br>
<br></blockquote></div><br></div>
_______________________________________________<br>UNSUBSCRIBE from this page: <a href="http://mailman.uib.no/options/corpora">http://mailman.uib.no/options/corpora</a><br>Corpora mailing list<br><a href="mailto:Corpora@uib.no">Corpora@uib.no</a><br><a href="http://mailman.uib.no/listinfo/corpora">http://mailman.uib.no/listinfo/corpora</a><br></blockquote></div><br></div></body></html>