Home > <080>データ処理テクニック紹介

「データ処理テクニック紹介」の一覧

データのサンプリング

測定は細かく・必要なデータだけ取り出す

データを測定するときには、できるだけサンプリングの周期を短く設定します。
というのは、測定で粗くしてしまうと、あとでもっと詳細なデータが必要となったとき、測定をやり直さなくてはなりません。
測定はできるだけ、細かく、タイムスパンを短く設定して行います。
必要なデータがもっと粗くてよいのであれば、細かく測定した中から、粗いデータを抽出すればよいのです。
1分間隔で測定したデータから、1時間間隔で取り出すのは簡単です。
しかし、1時間間隔で収集したデータから、1分間隔のデータを取り出すことはできないからです。



測定データから必要なデータを取り出す方法

数式を入力する:1~10の繰り返しを作成する

まず、1分間隔で収集したデータから、10分間隔のデータを抽出してみましょう。

sampling6.jpg



E3には、次の式を入力します。
=mod(row()-3,10)+1
row():行番号を求める関数です。E3のセルにこの式を入力すると、「3」を返します。
つまり、E3に入力されたrow()-3は「0」になります。
E4にこの式が入力されると、E4の行番号が4なので、4-3となり、row()-3は「1」を返すことになります。


mod:この関数は割り算の余りを求めます。
それで、E3にmod(row()-3,10)と入力すると、行番号から3を引き、10で割った余りを求めるということになり、答えは「0」になります。
それで、最後に1を加えて、答えが「1」になるように調整するのです。
なかなか、難しいでしょうか。


同じ式がE4に入力されると、4行目の行番号から3を引き、答えは「1」になりますが、10で割って余りを求めると、答えは「1」です。
調整の「1」が加算されますので、数式の答えは2になります。
この全く同じ式をデータの終わりまで入力すると、1~10までの数が繰り返し入力されます。
そして、数式を単なる数字に置き換えたのち、この列をキーにしてデータをソートすると、「1」のかたまり、「2」のかたまり、・・・とデータが並べ替えられますので、抽出間隔が「1」のデータだけをコピペして、取り出せば、10分間隔のデータを取り出すことができます。


1時間間隔のデータを抽出する場合は、10ではなく、60にすればよいことになります。
わかれば簡単です。
手順を説明しますので、慣れれば、どんなにデータ数が多くても、全行程で10秒程度の作業時間です。同じようにやってみてください。



数式のコピペ

sampling7.jpg

数式を入力したセルの右下端にカーソルを合わせると、上図のようにカーソルが黒「+」になります。
マウスの左ボタンをダブルクリックしてください。


正しくできれば、次図のように、数式が最後の行まで一気に入力され、1~10、1~10、1~10とどこまでも繰り返されます。

sampling8.jpg



数式を取り除いて、数値に変換する

作成した数値のセルをキーに並べ替えを行います。ソートでは数式が邪魔をしますので、単なる値に変換します。

sampling9.jpg

数式が入力されましたら、すべての数式が選択されている状態で、セルを右クリックし、メニューから、「コピー」を選びます。



sampling10.jpg

続いて、右クリックして、今度は、「形式を選択して貼り付け」を選びます。



sampling11.jpg

オプションから、「値」を選択して、「OK]をクリックします。



sampling12.jpg



図のように、数式がなくなって、ただの数値だけになります。

ソートすると

繰り返し数が入力されている列をキーにしてソートすると、1,2,3,・・・10,1,2,3,・・・10というデータの並びが、1,1,1,・・・・1,2,2,2,・・・,2,3,3,3,・・・3,・・・・10,10,10,・・・10というデータの並びに変わります。

この中からたとえば、1のデータだけを取り出すと、10分間隔のデータを取り出したことになります。

説明では、わかりにくいと感じられる場合もあるでしょうから、参考に、数式が入ったExcelのファイルをアップしておきますので、ダウンロードして使ってください。

先頭へ



機器名称の設定

測定データの管理

データを収集し始めると、管理が重要になります。
測定した直後は、何を測定したのか記憶していますが、いろいろな機器を測定するようになると、
記憶があいまいになります。
次の図のようにして、機器の名称を設定しておくことが、データの管理に重要です。
「設定」-「名称設定」を選択して、名称設定画面を表示します。

name2.jpg



もちろん、ファイル名のつけ方や、データを保存するフォルダなどで、分類することはできますが、
測定開始のときに、名前を付けておくことが何よりも安全な方法です。



機器の名称とデータがペアで残る

次図のように、保存したデータの中に、機器の名称が記録されますので、 わかりやすくなります。

name.jpg

先頭へ



測定時間・電力量の計算

ワットアワーメーター管理プログラムで測定できること

ワットアワーメーター本体で表示できる測定項目は、ボタン操作にっていろいろありますが、 管理プログラムがデータ収集するデータは限定的です。次の4つのデータが、測定周期ごとに取得されます。

  1. データの日時:年、月、日、時、分、秒
  2. 経過時刻(分単位)
  3. 積算電力量
  4. 測定電力

測定日時の情報から、個別の年、月、日、時、分、秒の情報を取り出す方法は、「日時データ:各要素の取得」に書いてありますので、参考にしてください。


測定時間

測定時間は、「0:02」、「0:04」、「1:44」、「1:46」のように、「時:分」の形式で表示されます。
感覚的には、わかりやすいのですが、計算上は、1時間44分を「1:44」と表示するよりも、「104分」とした方が扱いやすいデータになります。
下図のように、「=A3-$A$3」と入力します。(例ではK列に。E列~J列は、日時データを取得する例で使ったデータが入っていますので、ここでは画面を見やすくするため、非表示にしています)

timeinfo-1.jpg

先頭へ



数式の参照形式に注意

A3は相対参照という形式のデータです。
このデータは別のセルへ式をコピーすると、位置関係がその分シフトするようにするセルの参照形式です。
式の後半の「$A$3」は、この式をコピーした場合も、シフトすることなく、A3を参照させる書き方で、絶対参照形式といいます。
列名のみを絶対参照にした「$A3」という参照形式、逆に行番号のみを絶対参照にした「A$3」という参照形式も有効です。このように、絶対参照と、相対参照を混合した形式は、混合参照と呼びます。
この数式は、セルをコピーしたとき、威力がわかります。



「=A3-$A$3」と入力して、確定すると、下図のような妙な結果になります。

先頭へ



セルの書式を調整する

別に驚くことはありません。これは、Excelが自動で適用するデータへの書式間違っているだけです。書式を変更しましょう。「Ctrl」+「1」(コントロールキーと数字の1)を同時に押します。すると、セルの書式設定ダイアログが表示されます。

timeinfo-3.jpg



左側の分類が「ユーザー定義」、右側の「種類」が、「yyyy/m/d h:mm」となって反転しています。右側の欄の上の方にも同じ内容が表示されています。こちらの方を次のように変更します。「[m]」。OKをクリックします

timeinfo-4.jpg



先頭へ

数式の結果は0:この式を複写する

下図のように「0」となったはずです。A3のセル同士(同じ値)の引き算ですから、0になるのが当たり前です。
「0」のセルの右下のコーナーにマウスを合わせて、カーソル形状が下図のように変わったら。ダブルクリックします。

timeinfo-5.jpg



数式が最後のセルまで入力されます。セルの値は測定時間を分で現した値です。先ほどの書式設定で「m」は分で表示するようにという指示です。[m]と括弧で囲んだのは、60分を超えても、「時」に繰り上がることなく、分を加算して表示させるための設定です。

timeinfo-6.jpg



他のセルの数式を見ると、コピーしたセルの位置によって、A3と入力した方は、A4、A5と変化していきますが、$A$3とした方は、位置が変わっても、$A$3のままです。数式をコピーするときの基本的なテクニックです。

timeinfo-7.jpg

先頭へ



日時データ:各要素の取得

日時のデータの列幅を調整する

日時のデータが「######」と表示されています。これは、Excelの列幅が狭すぎるため、正しく表示できないためです。

columns-widthsfitting.jpg


上図のように、A列とB列の列名の間にマウスカーソルを合わせると、カーソルの形が、両方向の矢印型に変わります。この状態のときに、マウスの左ボタンをダブルクリックします。


次図のように、測定日時のデータが正しく表示されます。
表示が変わらない場合は、ダブルクリックの位置が正しくないか、ダブルクリックの間隔が遅すぎるのどちらかです。マウスの位置を確認し、ダブルクリックの速度に気をつけてやり直してください。
列幅調整のためのダブルクリックは、その列の一番大きなデータのサイズに列幅をフィットさせます。
この後では、説明しませんが、日時のデータを取り出したセルの幅の調整も、この方法で実行しています。

columns-widthfitting2.jpg

先頭へ


年、月、日、時、分、秒を個別に取り出す

データ処理をする場合、Excelの日付、時刻データは、理解するとたいへん便利なのですが、内容を知らないと非常に扱いにくいデータです。ここでは、測定日時のデータを個別にセルに取る出す方法を説明します。


年のデータをE列に取り出す

日付データから、「年」の要素を取り出すには、「Year」という関数を使います。下図は、E3のセルに、「=year( 」と入力した場面です。

getdata.jpg


キーボードで数式を入力し、マウスでセルをクリック

左側のカッコまで入力したら、A3のセルをマウスカーソルで、クリックします。クリックした場面が紫檀も図です。数式の中に「A3」の文字が入ります。ここで閉じる右カッコを入力すると数式が完成します。マウスでクリックするよりもキーボードでA3と入力する方が簡単なら、キーボードから入力してください。どちらでもOKです。

getdata2.jpg


年のデータ「2009」がセルに表示される

数式が正しく入力されると、セルには、数式の結果、この場合は「2009」という年の値が表示されます。

get-yeardata.jpg

先頭へ


年以外の情報を取り出すための数式を入力する

年のデータが取り出せたら、今度は「月」から「秒」までのデータを取り出します。

  • 年は:=year(A3)
  • 月は:=month(A3)
  • 日は:=day(A3)
  • 時は:=hour(A3)
  • 分は:=minute(A3)
  • 秒は:=second(A3)
E列から順にJ列まで同じやり方で入力します。 入力した数式は次の図のようになります。

getdata-all.jpg


正しく入力できると、セルには年、月、日、時、分、秒のデータが表示されます

getdata-all2.jpg


A列にはなかった秒のデータも取り出せたことに気づかれましたか。このことについては、別のところで改めて説明いたします。

先頭へ


最初の行の数式を全データ行に適用する

最初のデータ行に数式を入力しましたが、測定データは大量にあります。24時間1分周期ですと、
2400行にもなります。しかし、何千行のデータでも、関係ありません。ダブルクリック1回で、数式をコピーできます。最初に、下図のように数式を入力したセルを選択します。

select-sushiki.jpg


選択した範囲の右下のコーナーにマウスカーソルを合わせると、カーソルの形状が図のように黒い細い十字に変わります。その状態で、ダブルクリックします。

autofil.jpg


データが何千行あっても、最後の行まで、数式が一気にコピーされます。
次の図のとおりです。残念ながら、どれだけの行にコピーされたか、画面の都合で、お見せできませんが、ぜひ、御自分で実際に操作して、確かめてください。この方法は、覚えておくと便利です。いろいろなときに使えますし、相当作業時間の短縮ができます。

autofil-all.jpg

先頭へ



Excel形式でデータ保存

データはExcelに読み込まれる

ワットアワーメーターの管理プログラムを使ってデータを収集すると、CSV形式でデータが保存されます。パソコンに、Excelがインストールされていると、通常は、データファイルをダブルクリックしたときに、Excelに読み込まれて、表示されます。


データの保管と計算処理のために

最初にやることは、このデータをExcel形式で保存しなおすことです。
Excel形式で保存することには2つの利点があります。

  1. 形式の違うデータができるので、もとのデータがそのまま保存される。
  2. Excel形式のデータをどのように扱っても、(場合によっては、データを壊してしまっても)もとのデータは、安全に残っているということです。これは一番重要な点です。


  3. CSV形式では保存できない数式や処理を埋め込んで、データを処理、解析できる。
  4. 測定したデータは、いろいろ加工、数式処理、分析、解析できます。その作業を完全に保存できるのはExcel形式のファイルのみです。


Excel形式で保存する手順

  1. SCV形式のファイルを開いた状態で、「ファイル」-「名前をつけて保存」を選択します。
  2. save-newname.jpg


  3. ファイルの種類でExcelの通常の形式を選択します。Excelのバージョンはご自分の環境に合わせてください。この例ではExcel2003を使っていますが、2007でも基本的に変わりません。
  4. save-xls.jpg


  5. Excel形式で保存しても、タイトルバーのファイル名の拡張子がxlsに変わるだけで、メニューもワークシートの様子も変わりません。しかし、これで、Excelの能力をすべて使って処理をし、その結果を保存できるようになりました。
  6. saved-xls.jpg

先頭へ