「熙」の字でトラブった話

まさに昨日の今日の話だ。お客様から持ち込まれた名簿に「熙」の字が入っていて、たったそれだけのために会社を挙げての大騒動になってしまった。「熙」の字は「細川護熙」氏の名前にも使われているし、漢字を語るうえで避けては通れない「康熙字典」の「熙」でもある。そんなものがなぜいまさらトラブルになったのか。面白いので例によって表に出せる範囲でまとめておく。

※この記事は、JIS90以降の文字集合が表示できない環境だと、多分わけのわからないものになっていると思います。

この問題は、JISコード上の「熙」の字の歴史が大いに関係している。
JIS X 0208 は1978年以来、何度か改訂されている。改訂の際に字形が変わったり、新しい文字が追加されたりしている。「熙」の字はそのような改訂の中で面倒な目にあった文字の一つである。
まず簡単に経緯をまとめると、「熙」の字はJIS 78の段階では5F区66点として登録されていた。
これが、JIS90の段階で字形が「煕」と改められた。これだけなら字形が変わったという話で済んだのだが、この時点でさらに84区6点に「熙」が登録されてしまったのである。その理由は分からないのだが。


この件に関してコンピュータ的な問題は3つある。

一つは、5F区66点の字形の変更。まあ、字形の変更の問題は他でも語りつくされているので、ここでは省略する。

次の問題は、文字集合の数が増加したこと。JIS90以前はJIS第2水準の最後は84区5点だったのが、この改訂で84区6点になってしまった。プログラミングの際、「表示できない文字は扱わない」という要件定義がなされていた場合、JIS90 以前に対応したプログラムだと「84区6点」はエラーになってしまう。エラー処理するようになっていればまだしも、どうせ該当文字が無いのだからといって、何らかのプログラミングテクニックで84区6点以後を使っていたりしたらプログラム自体が暴走しかねない(私の勤め先ではエラー処理になっていた。JIS90に対応していないのに気づかずに2008年まで使ってきていたわけだ)。

最後の問題は、旧の字形が別の区点で登録されてしまったということ。これは事実上の区点の移動だ。すると、たとえば「細川護熙」さんが、同じ字形を使い続けたければJIS90以前のシステムとJIS90以降のシステムとで、「熙」の一文字について文字コードを使い分けなければいけないということだ。しかし、どのシステムがJIS90以前でどのシステムがJIS90以降かなど、いちいち調べようがないし、たとえ一文字といえどもシステムごとに文字コードを使い分けたりされたら後で名寄せができなくなってしまう。


なお現在、私の勤め先では、プログラムすべてがJIS90以降に対応しているのかどうかで大騒ぎになっている。プログラムだけではなくて、プリンターなども調べないといけないし、かなり手間がかかっている。

ブログ気持玉

クリックして気持ちを伝えよう!

ログインしてクリックすれば、自分のブログへのリンクが付きます。

→ログインへ

なるほど(納得、参考になった、ヘー)
驚いた
面白い
ナイス
ガッツ(がんばれ!)
かわいい

気持玉数 : 0

この記事へのコメント

この記事へのトラックバック