2007年12月07日

政府情報、ていうかCD-ROMとかのデータの永年保存について

 
 政府情報の管理についての講演やるよというので、社会科学分野のはあんまり興味ないんだけど、まあなんとなく、という感じで行ってみたら、その実は、統計情報とかがCD-ROMに収められていて、その中身のデータを吸い出してマイグレーション的なことをどうするべきか、という話だったので、とてもためになったよ。食わず嫌いはダメ、ゼッタイ。

・アメリカの政府情報を図書館で保存するということにあたって、10年以上の間、CD-ROMがメディアとして採用されてきてたらしい。ところが、それってどうなん、と。物理的にもどうなん、だし、過去の分の互換性的にもどうなん、だし、ほんまに全部が全部、今後も使いもんになってくれんの、ていう。(江上註:このへん、マイクロフィルム媒体のほうがよっぽどマシだったような気がする。)
・この問題にタックするプロジェクトがYale大学さんで行なわれたということで、その報告なんだけど、学生バイトにマイグレーションをやらせたよ、という話で、まずCD-ROMからサーバに移す→その中身を分析する→いくつかのファイルのファイル形式を移行させてみる(例:SETS(不明)→ASCII、Excel→ASCII、Word→txt)→エラーなり問題点なりを記録する→かかった時間を記録する。
・結果、CD-ROM1枚につき、かかった時間は1時間45分、バイト代は19ドル。但しプログラミングなどのコストは別。これ、どう?ていう。
・分かったこと。自己流でちまちまやるのは時間の無駄、ディスクそれぞれでワークフローを変えなきゃいけない可能性がある。ファイル形式の変換にはプログラミングのプロが必須。アウトソーシングじゃなくて、雇用が必要。長期保存にはASCIIファイルがベスト。ワークフローのベスト・プラクティスについて蓄積と評価が必要。メタデータがなきゃ何も意味がない。
・問題。データの羅列だけなら移行にとりかかれる、けど、CD-ROMに収められたコンテンツはもはやひとつの宇宙、どうやって移行させる? そして移行させたものを、シロウトさんは使えるの? そもそもシロウトさんが使いやすいようにいろいろ手を加えてくれてたのが、各CD-ROMだったわけだし。あと、もちろん著作権と、お金。

 いずれにせよ問題は、利用者への提供をどう保証するか、そのためにどう戦略的に動くか、ということであって、それは決して「はい、これがCD-ROMです」ってぽおんと手渡すことじゃないんだよ、という話でしたよ。

posted by egamihvu at 09:57| Comment(0) | TrackBack(0) | 日記 | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
コメントを書く
お名前: [必須入力]

メールアドレス:

ホームページアドレス:

コメント: [必須入力]

認証コード: [必須入力]


※画像の中の文字を半角で入力してください。
※ブログオーナーが承認したコメントのみ表示されます。

この記事へのトラックバック
×

この広告は1年以上新しい記事の投稿がないブログに表示されております。