Home > <080>データ処理テクニック紹介 > データのサンプリング

データのサンプリング

測定は細かく・必要なデータだけ取り出す

データを測定するときには、できるだけサンプリングの周期を短く設定します。
というのは、測定で粗くしてしまうと、あとでもっと詳細なデータが必要となったとき、測定をやり直さなくてはなりません。
測定はできるだけ、細かく、タイムスパンを短く設定して行います。
必要なデータがもっと粗くてよいのであれば、細かく測定した中から、粗いデータを抽出すればよいのです。
1分間隔で測定したデータから、1時間間隔で取り出すのは簡単です。
しかし、1時間間隔で収集したデータから、1分間隔のデータを取り出すことはできないからです。



測定データから必要なデータを取り出す方法

数式を入力する:1~10の繰り返しを作成する

まず、1分間隔で収集したデータから、10分間隔のデータを抽出してみましょう。

sampling6.jpg



E3には、次の式を入力します。
=mod(row()-3,10)+1
row():行番号を求める関数です。E3のセルにこの式を入力すると、「3」を返します。
つまり、E3に入力されたrow()-3は「0」になります。
E4にこの式が入力されると、E4の行番号が4なので、4-3となり、row()-3は「1」を返すことになります。


mod:この関数は割り算の余りを求めます。
それで、E3にmod(row()-3,10)と入力すると、行番号から3を引き、10で割った余りを求めるということになり、答えは「0」になります。
それで、最後に1を加えて、答えが「1」になるように調整するのです。
なかなか、難しいでしょうか。


同じ式がE4に入力されると、4行目の行番号から3を引き、答えは「1」になりますが、10で割って余りを求めると、答えは「1」です。
調整の「1」が加算されますので、数式の答えは2になります。
この全く同じ式をデータの終わりまで入力すると、1~10までの数が繰り返し入力されます。
そして、数式を単なる数字に置き換えたのち、この列をキーにしてデータをソートすると、「1」のかたまり、「2」のかたまり、・・・とデータが並べ替えられますので、抽出間隔が「1」のデータだけをコピペして、取り出せば、10分間隔のデータを取り出すことができます。


1時間間隔のデータを抽出する場合は、10ではなく、60にすればよいことになります。
わかれば簡単です。
手順を説明しますので、慣れれば、どんなにデータ数が多くても、全行程で10秒程度の作業時間です。同じようにやってみてください。



数式のコピペ

sampling7.jpg

数式を入力したセルの右下端にカーソルを合わせると、上図のようにカーソルが黒「+」になります。
マウスの左ボタンをダブルクリックしてください。


正しくできれば、次図のように、数式が最後の行まで一気に入力され、1~10、1~10、1~10とどこまでも繰り返されます。

sampling8.jpg



数式を取り除いて、数値に変換する

作成した数値のセルをキーに並べ替えを行います。ソートでは数式が邪魔をしますので、単なる値に変換します。

sampling9.jpg

数式が入力されましたら、すべての数式が選択されている状態で、セルを右クリックし、メニューから、「コピー」を選びます。



sampling10.jpg

続いて、右クリックして、今度は、「形式を選択して貼り付け」を選びます。



sampling11.jpg

オプションから、「値」を選択して、「OK]をクリックします。



sampling12.jpg



図のように、数式がなくなって、ただの数値だけになります。

ソートすると

繰り返し数が入力されている列をキーにしてソートすると、1,2,3,・・・10,1,2,3,・・・10というデータの並びが、1,1,1,・・・・1,2,2,2,・・・,2,3,3,3,・・・3,・・・・10,10,10,・・・10というデータの並びに変わります。

この中からたとえば、1のデータだけを取り出すと、10分間隔のデータを取り出したことになります。

説明では、わかりにくいと感じられる場合もあるでしょうから、参考に、数式が入ったExcelのファイルをアップしておきますので、ダウンロードして使ってください。

先頭へ



カテゴリ: データ処理テクニック紹介