ハイフンとダッシュとマイナスと

SJISとUTF8の文字コード変換に関する文字化けを調べていて、大きな勘違いに気づいた。「-」は全角ダッシュではなかったのだ。知っている人に言わせれば当たり前のことなのだろう。また、知らない人にとっては「-」が全角ダッシュだろうが何だろうが関係のない話なのだろう。その中間の人、すなわち「-」が全角ダッシュかどうかで悩む人がほとんどいないというのが、問題を難しくしている最大の原因だったのだ。
とりあえず違いのわかりやすい資料としては、 「従来の文字コードとUnicodeの対応に関する諸問題」( http://euc.jp/i18n/ucsnote.ja.html ) に「2.似た文字」という記述があるので参考にしてほしい。
一見、単なる横棒に見える文字記号でも文字コード別にカウントすると16種類くらいになってしまうのだ。
で、今回私がひっかかっていた「-」はキーボードの「=」「-」「ほ」の刻印のあるキーを押してF9を一回押して変換(MS-IMEでデフォルト設定の場合)して表示される文字で、正しくは「全角マイナス」という文字だったのだ。
いくら「全角ダッシュ」という単語で検索をかけても問題解決につながる情報が得られなかったわけだ。
出版業界の片隅に身を置く人間として、この区別がついていなかったのは非常に恥ずかしいことなのだが、ひとつだけ言い訳をさせてもらうと「-」が全角ダッシュであり、EMダーシであると思い込んでいたために、まったくこれに疑問を感じる余地がなかったのだ。多分これまでも、知らず知らずの間にきっと、印刷会社さんなどに迷惑をかけていたのに違いない。まったくもってお恥ずかしい。

とはいえパソコン上では、結局結論は昨日のとおりで、Windowsの文字コード変換ライブラリと、iconvとMacOSとMySQL内蔵ライブラリとで変換テーブルが異なるためにうまくいくわけがないというところに落ち着くのだが。

ブログ気持玉

クリックして気持ちを伝えよう!

ログインしてクリックすれば、自分のブログへのリンクが付きます。

→ログインへ

なるほど(納得、参考になった、ヘー)
驚いた
面白い
ナイス
ガッツ(がんばれ!)
かわいい

気持玉数 : 1

なるほど(納得、参考になった、ヘー)

この記事へのコメント

この記事へのトラックバック