計算機によるデータ解析入門 - 効率的な作業を目指して -

計算機によるデータ解析入門 - 効率的な作業を目指して -

(一部工事中、順次拡張予定)

ここでは、データファイル処理のコツや便利なUNIXコマンドの紹介、図の簡単な作成方法、C言語の解説などを行なっています。

世の中には上記に関する数多くの教科書・マニュアル・解説サイトがありますが、それらの多くは文法をしっかり記述しているものの、実際の細かい応用の仕方に関しては、触れられていないものも多いと感じます。

例えば、「実際に使うときは、この変数には括弧をつけるの?」とか「else文を2回続けて入れるときの区切り子は?」といった疑問は文法だけの解説ではわかりにくいことが多く、実際の応用例を見ることが有効です。ここでは、データ処理の実用に即した例を列挙することで、より実戦的な解説を試みています。

研究・作業の効率化、省力化の為にぜひどうぞ。 なお、読者はある程度UNIX並びにC言語またはFortranに慣れている方を想定しています。


データファイル処理に便利なUNIXコマンド

データ解析を行っていると、データを様々な形に加工しなくてはならない場面に遭遇します。 いちいちCやFortranといった高級言語で変換プログラムを作っても良いのですが、 UNIXには予めこのようなデータ加工に役立つコマンドが数多く存在します。 大抵のことは、これらの既存のコマンドを組み合わせることで実現できるものです。

パイプライン処理・標準入出力によるデータ処理

データ解析をUNIX上で行う際には、様々なコマンドを組み合わせることで多様な加工を行うことができます。 その際に必要となる知識は、どのようにしてコマンド間でデータのやり取りを行うか、ということです。 コマンド間のデータはパイプライン処理により結びつけることができ、 その際の入出力の種類が標準入出力と呼ばれます。

シェルスクリプトによるデータ処理

UNIXコマンドを組み合わせてデータ解析を行うには、コマンドラインだけで行うには限界があり、 一種のプログラミングのように処理の手順をUNIXコマンド群の組み合わせでファイルに記述できると便利です。 シェルスクリプトとは、UNIXコマンドの組み合わせを実行させる簡単なプログラミングのようなものです。 高級言語のようにあらゆることができるわけではありませんし、速度も遅いですが、ちょっとした処理を 行うには十分です。

gnuplot 応用編(計算結果をすぐ見たい!)

データ解析が終わったら、今度はデータを目に見える形で図にしなくてはなりません。 また、データ解析の途中でもチェックの為にちょっと図を作って見たいということがあるでしょう。 gnuplot内からUNIXコマンドを呼び出すことで、ファイルに結果を保存せずに直接結果をプロットすることができます。



計算機によるデータ解析入門のページに戻る

野口のTopページに戻る

情報科学科のTopページに戻る