« UTF8対応のChaSenインストール | メイン | エンターキーの押下でフォームの送信を行わないようにする »

UTF8対応のMeCabインストール

ChaSenに続いて、UTF8対応のMeCabインストール。
そんなに悩むことはなかったりする。
ついでにSennaに対応させるのpatchもあてた。

ダウンロード

# wget http://chasen.org/~taku/software/mecab/src/mecab-0.81.tar.gz  
# wget http://dev.razil.jp/archive/mecab-0.81.mte.patch      
# wget http://chasen.naist.jp/stable/ipadic/ipadic-2.5.1.tar.gz    

展開して、ipadic-2.5.1.tar.gzをmecabのディレクトリにコピー

# tar zxf mecab-0.81.tar.gz            
# cp ipadic-2.5.1.tar.gz mecab-0.81/dic/             
# cd mecab-0.81/dic/          
# tar zxf ipadic-2.5.1.tar.gz 

patchをあてて、make

# cd ..       
# patch -p1 < ../mecab-0.81.mte.patch     
# ./configure --enable-mutex --prefix=/usr --with-charset=utf8     
# make
# make install


Perl bindingのインストール。

# wget http://www.chasen.org/~taku/software/mecab/bindings/mecab-perl-0.81.tar.gz 
# cd mecab-perl-0.81
# perl Makefile.PL 
# make
# make test
# make install


おそらくmake testの結果は文字化けしてる。けどOK