固定長またはCSVでいいのかな?(4)

固定長、CSVだけがデータ形式ではない。最近は、事前の打ち合わせがあったわけでもないのに、Excel形式のデータが持ち込まれるケースが増えている。幸いデータの並び順が、私たちの指定しているCSV形式と同じなので、えいやっとCSVにエクスポートしてしまえば使えることが多い。しかし、Excel形式は問題があまりに多い。
固定長なり、CSVなりのデータは、まあ、曲がりなりにも、多少はコンピュータというものを理解している人が作ったデータだ。特に固定長のデータなら、まあ、間違いのある可能性は少ない。CSVなら、多少の間違いはあっても、まあ、知れている。しかし、Excel形式の場合、古き良き大型コンピュータの時代など知らない人がデータを作るものだから、この形式で持ち込まれるデータのバリエーションは半端ではない。

まず多いのが、作業用に入れたコメントの消し忘れ。「3月末退職予定」なんてコメントが入っていたらこちらもどきっとしてしまう。Excel固有のメタデータ(ファイル作成者情報など)に、危ない情報が入っていることもある。ハッカーご用達のツールを使うともっと色々なデータが取り出せそうなのだが、本当に危ないデータが出てきてしまうと取り扱いに困るのはこちらなので、深く詮索はしないようにしている。
次に問題になるのが、勝手なフォーマット変更。所々、見た感じを整えるためにセルを結合してあったり、セル内改行をしていたりと、どうやってCSVに変換したらいいものか、分からないような複雑なデータになっていたりする。とにかく、あらゆる技のオンパレードになっており、安全にデータを抽出できない状態になっているのだ。カラフルで見た目に分かりやすいのはありがたいのだが...。

というわけで、結局のところ、Excel形式の利点って何なのだろうか。
固定長やCSVの作り方を知らない人でも、直感的にデータを作ることができて、しかも電子データになっているので、メールなどでやり取りしやすいということで、結論だろうか。
信用して使うことが出来ないデータなのだから、固定長やCSVと比べると、ものすごくありがたみの少ないデータ形式であることは確かだ。

本当に分かっている人は、作業はExcelでも、受け渡しの際はCSVなどにエクスポートするだろう。

ブログ気持玉

クリックして気持ちを伝えよう!

ログインしてクリックすれば、自分のブログへのリンクが付きます。

→ログインへ

なるほど(納得、参考になった、ヘー)
驚いた
面白い
ナイス
ガッツ(がんばれ!)
かわいい

気持玉数 : 0

この記事へのコメント

2008年04月14日 19:48
このシリーズを一通り読ませていただきました。
.csv形式のデータはよく扱います。
しかし、固定長のデータを扱ったことはありません。
どのようにして受け渡しをされているのか、シリーズの続きで教えて頂けませんか?
kazuyoshikakihara
2008年04月15日 01:09
リクエスト賜りました。きりのいいところで再度固定長の話を挟むことにします。

この記事へのトラックバック