...ing logging 4.0

はてなブログに移行しました。D言語の話とかいろいろ。

実験データのフォーマット

ほんとにしょうもないけど知らない人がいそうなので書いてみる.

他の研究グループの人たちは,どんなフォーマットで実験データを出力させているんだろう.自分ら(というか自分)の場合は,テキストデータをコンマ区切り(CSV)で出力している.CSVだと,PerlとかAWKとかのプログラムでテキスト処理しやすいから.指定したフォルダ以下のデータファイルが一気に処理されていくのは見ていてちょっと楽しい.え,楽しくないって?

ただ,ほとんどのデータはExcelで処理することになるはずだ.もし,最初からExcelで処理する前提のデータなら,CSVはちょっと問題がある.CSVからセルごとに対応づけてインポートしてくれるウィザードがあるのだが,インポートするファイルが多いときはそのウィザードを通すのがかなりの手間になる.そこでCSVよりもいいフォーマットがある.それはタブ区切り.タブ区切りのテキストデータだと,ファイルの拡張子を .xls にして普通にアイコンをダブルクリックして開くだけで,データはセルごとに対応づけられる.Excelでたくさんのファイルをインポートする手間をなくしたい人はタブ区切りのテキストファイルを使うといい.

最初に述べたように,自分の場合は最初こそCSVで出力しているんだけど,最終的にはPerlとかで簡易テキスト置換プログラムを書いて,コンマをタブに置換している.それと同時にエクセルで処理しやすいように細々と工夫してみたりもする.こういう,なかなか繰り返し使わないようなプログラムを書くために,Perlみたいなスクリプト言語を最低一つ覚えておくといい.機械に出来ることは,人間がわざわざ手でやるもんじゃない.それでなくても頭を使うことで忙しいはずなんだから.

# 日本産スクリプト言語Rubyって初心者でも上級者でも使える言語みたいでちょっと面白そうだなと思っていたり
## また違う言語に手を出すのか?