民芸的プログラミング 〜ソフトウェア開発日記〜

アクセスカウンタ

zoom RSS ハイフンとダッシュとマイナスと

<<   作成日時 : 2008/05/30 09:37   >>

なるほど(納得、参考になった、ヘー) ブログ気持玉 1 / トラックバック 0 / コメント 0

SJISとUTF8の文字コード変換に関する文字化けを調べていて、大きな勘違いに気づいた。「−」は全角ダッシュではなかったのだ。知っている人に言わせれば当たり前のことなのだろう。また、知らない人にとっては「−」が全角ダッシュだろうが何だろうが関係のない話なのだろう。その中間の人、すなわち「−」が全角ダッシュかどうかで悩む人がほとんどいないというのが、問題を難しくしている最大の原因だったのだ。
とりあえず違いのわかりやすい資料としては、 「従来の文字コードとUnicodeの対応に関する諸問題」( http://euc.jp/i18n/ucsnote.ja.html ) に「2.似た文字」という記述があるので参考にしてほしい。
一見、単なる横棒に見える文字記号でも文字コード別にカウントすると16種類くらいになってしまうのだ。
で、今回私がひっかかっていた「−」はキーボードの「=」「-」「ほ」の刻印のあるキーを押してF9を一回押して変換(MS-IMEでデフォルト設定の場合)して表示される文字で、正しくは「全角マイナス」という文字だったのだ。
いくら「全角ダッシュ」という単語で検索をかけても問題解決につながる情報が得られなかったわけだ。
出版業界の片隅に身を置く人間として、この区別がついていなかったのは非常に恥ずかしいことなのだが、ひとつだけ言い訳をさせてもらうと「−」が全角ダッシュであり、EMダーシであると思い込んでいたために、まったくこれに疑問を感じる余地がなかったのだ。多分これまでも、知らず知らずの間にきっと、印刷会社さんなどに迷惑をかけていたのに違いない。まったくもってお恥ずかしい。

とはいえパソコン上では、結局結論は昨日のとおりで、Windowsの文字コード変換ライブラリと、iconvとMacOSとMySQL内蔵ライブラリとで変換テーブルが異なるためにうまくいくわけがないというところに落ち着くのだが。

テーマ

関連テーマ 一覧


月別リンク

ブログ気持玉

クリックして気持ちを伝えよう!
ログインしてクリックすれば、自分のブログへのリンクが付きます。
→ログインへ
気持玉数 : 1
なるほど(納得、参考になった、ヘー)

トラックバック(0件)

タイトル (本文) ブログ名/日時

トラックバック用URL help


自分のブログにトラックバック記事作成(会員用) help

タイトル
本 文

コメント(0件)

内 容 ニックネーム/日時

コメントする help

ニックネーム
本 文
ハイフンとダッシュとマイナスと 民芸的プログラミング 〜ソフトウェア開発日記〜/BIGLOBEウェブリブログ
文字サイズ:       閉じる