民芸的プログラミング 〜ソフトウェア開発日記〜

アクセスカウンタ

zoom RSS 人名を検索するには?(2) kakasiの場合

<<   作成日時 : 2008/07/09 00:05   >>

ブログ気持玉 0 / トラックバック 0 / コメント 0

別件でkakasiを使う機会があった。ついでにkakasiの辞書を調べていて気付いたのだが、どうやらkakasiは意地で人名でも形態素解析をやろうとしているらしい。地名や人名と思しき単語がたくさん登録されている。実際、ありきたりの苗字ならば綺麗に分かち書きしてくれる。こいつをこまめに鍛えていけば、通常のDBMSと併用する形で、人名だけNamazuで検索するシステムというのも考えられなくはないようだ。
いや、でもそのようなことをするくらいなら、最初から人の手で、姓名を分かち書きするだろう。
いくら辞書を鍛えてもkakasiでの姓名分かち書きの精度が100%に到達することはまずありえない。素直にインデックス漏れの心配が無いbi-gramを利用するべきだ。

本日現在、まだ、bi-gram実証用のコードをまったく書けていないので説得力が微妙なのだが。

テーマ

関連テーマ 一覧


月別リンク

ブログ気持玉

クリックして気持ちを伝えよう!
ログインしてクリックすれば、自分のブログへのリンクが付きます。
→ログインへ

トラックバック(0件)

タイトル (本文) ブログ名/日時

トラックバック用URL help


自分のブログにトラックバック記事作成(会員用) help

タイトル
本 文

コメント(0件)

内 容 ニックネーム/日時

コメントする help

ニックネーム
本 文
人名を検索するには?(2) kakasiの場合 民芸的プログラミング 〜ソフトウェア開発日記〜/BIGLOBEウェブリブログ
文字サイズ:       閉じる