ChasenとKakasiの形態素解析の比較
Chasenネタがつづくけど。
一つ前のは、これを作っていたときのメモだということで。
Chasen(2.3.3)とKakasi(2.3.4)の形態素解析の結果を比較できます。Chasenは前回の記事に書いてある設定をしてあります。処理の比較等はMeCabのページ等に載っています。
一般的に言われている通り、Chasenの方が処理が細かいです。
Kakasiは名詞はきちんと分割されているように思えますが、助詞、動詞、ひらがながつづくところはだめみたいです。ただしい文章はただしく解析されるけど、普段の言葉遣いだときついですね。
処理はKakasiの方が軽いと言われているのでこの結論面白くないけど、一長一短、適材適所だと思われ。
MeCabも試そうっと。