民芸的プログラミング 〜ソフトウェア開発日記〜

アクセスカウンタ

zoom RSS 住所を正規表現で

<<   作成日時 : 2009/10/07 23:38   >>

ブログ気持玉 0 / トラックバック 0 / コメント 0

仕事柄、WEBサイトでお客さんに住所を入力してもらって、そこに郵便物を届けることがよくある。
そして、その際、お客さんが住所を入力し間違えることがよくある。
多いのが、「東京都新宿区1−2−3」のように町名を入れ忘れるパターン。
これを防ぐためにあれこれと知恵を絞っている中で、住所を正規表現で表してマッチング処理をさせてはどうかという、普通ではないが面白そうなアイデアが浮かんだ。

ちょっと考えただけでも、京都だとか北海道だとかの変態的な地名表現が難しいことが分かる。
他にも、都道府県名を省略された場合にどう対処するかなど、考えることは多い。
しかも、市町村合併などがあると、住所は「変わる」のである。

それを一から自分で考えるのは大変過ぎるということで、まずは「住所 正規表現」で Google 先生にお伺いを立ててみた。
すると、掘り出し物のページが見つかった。

http://tech.yappo.jp/docs/yapcasia2007tokyo/geo/

これは、Perl のモジュールの話のようだ。
なるほど、うまくやれば住所を解析するプログラムは書けそうだ。
というか、日本の地名、プログラミング的には怖すぎ。

今日の所は、「やればできそうだ」というところで一段落とする。

ところで、日本の地名のデータベースといえば、郵便局のページの郵便番号一覧が秀逸なのだが、「以下の地番を除く」などといった言葉がもろにデータ内に入ってしまっているのが致命的。
データとして第三者に活用されないようにわざとやっているのだろうか?

テーマ

関連テーマ 一覧


月別リンク

ブログ気持玉

クリックして気持ちを伝えよう!
ログインしてクリックすれば、自分のブログへのリンクが付きます。
→ログインへ

トラックバック(0件)

タイトル (本文) ブログ名/日時

トラックバック用URL help


自分のブログにトラックバック記事作成(会員用) help

タイトル
本 文

コメント(0件)

内 容 ニックネーム/日時

コメントする help

ニックネーム
本 文
住所を正規表現で 民芸的プログラミング 〜ソフトウェア開発日記〜/BIGLOBEウェブリブログ
文字サイズ:       閉じる