« Chasen 英数字が混在する文字列の扱い | メイン | MeCabを追加 »

ChasenとKakasiの形態素解析の比較

Chasenネタがつづくけど。
一つ前のは、これを作っていたときのメモだということで。

ChasenとKakasiの形態素解析の比較

Chasen(2.3.3)とKakasi(2.3.4)の形態素解析の結果を比較できます。Chasenは前回の記事に書いてある設定をしてあります。処理の比較等はMeCabのページ等に載っています。


一般的に言われている通り、Chasenの方が処理が細かいです。
Kakasiは名詞はきちんと分割されているように思えますが、助詞、動詞、ひらがながつづくところはだめみたいです。ただしい文章はただしく解析されるけど、普段の言葉遣いだときついですね。

処理はKakasiの方が軽いと言われているのでこの結論面白くないけど、一長一短、適材適所だと思われ。
MeCabも試そうっと。

トラックバック

この一覧は、次のエントリーを参照しています: ChasenとKakasiの形態素解析の比較:

» MeCabを追加 from blog.nomadscafe.jp
MeCabを形態素解析の比較に追加しました。 これでChasen、Kakasi、MeCabの3つでの比較ができます。 ついでにページタイトルに「わかち書き」をいれました。この方が正しいですね。 ChasenとKakasiとMeCabの形態素解析・わかち書きの比較 お試しください。 MeCabは速度が揺... [詳しくはこちら]