<span class="Apple-style-span" style="font-family: arial, sans-serif; font-size: 13px; background-color: rgb(255, 255, 255); ">Hi,</span><div><font class="Apple-style-span" face="arial, sans-serif"><br></font></div><div><font class="Apple-style-span" face="arial, sans-serif">Your best bet is to build a dictionary containing your terms.</font></div>

<div><font class="Apple-style-span" face="arial, sans-serif">Just do as follow :</font></div><div><font class="Apple-style-span" face="arial, sans-serif"><br></font></div><div><span class="Apple-style-span" style="font-family: arial, sans-serif; ">- create a foo.csv file, with one entry per line (no blank line)</span></div>

<div><font class="Apple-style-span" face="arial, sans-serif">eg :  自然言語処理,-1,-1,10,名詞,一般,*,*,*,*,自然言語処理,シゼンゲンゴショリ,シゼンゲンゴショリ</font></div><div><font class="Apple-style-span" face="arial, sans-serif">(note that you can add extra arguments like translation, comments, and so on)</font></div>

<div><font class="Apple-style-span" face="arial, sans-serif">(the '10' value is the cost of your entry the lower it is, the easier it is to be recognized when parsing text)</font></div><div><font class="Apple-style-span" face="arial, sans-serif"><br>

</font></div><div><font class="Apple-style-span" face="arial, sans-serif">- compile the dictionary. on my computer it goes :</font></div><div><font class="Apple-style-span" face="arial, sans-serif">/usr/lib/mecab/mecab-dict-index -d /usr/share/mecab/dic/naist-jdic-eucjp/ -u foo.dic -f utf-8 -t utf-8 foo.csv</font></div>

<div><font class="Apple-style-span" face="arial, sans-serif">you must provide an existing dictionary, and your .csv file</font></div><div><font class="Apple-style-span" face="arial, sans-serif">other arguments are : the dictionary file to be created (foo.dic), the encoding of your .csv file (-f utf-8), the encoding of the dictionary (-t utf-8)</font></div>

<div><font class="Apple-style-span" face="arial, sans-serif"><br></font></div><div><font class="Apple-style-span" face="arial, sans-serif">- run mecab</font></div><div><font class="Apple-style-span" face="arial, sans-serif">mecab -u foo.dic<br clear="all">

<div><br></div><div>Best luck,</div><div><br></div><div>pm</div><div><br></div><br><div>PS : </div></font><font class="Apple-style-span" face="arial, sans-serif">In case you have queries you can contact me directly ( pierre[dot]marchal[at]inalco[dot]fr )<div>

<br></div>-- <br>Pierre Marchal<br>ERTIM - INaLCO<br>49 bis avenue de la Belle Gabrielle<br>F-75012 PARIS<br>+33 1 80 51 95 21<br><br>
<br><br>
</font></div>