QC7つ道具のひとつであるヒストグラムの説明をいたします。エクセルで作成する方法も一緒にご説明いたします。
自然現象はバラツキがあります。
理解しなければならないことは、自然現象はすべてバラツキがあるということです。私たちは自然現象の中で生活しているので、バラツキの中で生活しております。バラツキは自然現象だけでなく、製造物にもバラツキがあります。製造物のバラツキを減少させれば、安定した製品の製造ができるわけで、品質の安定につながります。
例えば、20歳の男性を1000人集めて身長を測定すれば、同じ身長の人がいても、全員同じ身長ではないはずですし、体重も同じです。
測定結果についてもバラツキが出てしまいます。
正規分布を理解しましょう
正規分布の細かな数学的なことを理解する必要はありませんが、簡単なことは理解しておきましょう。
まず、平均と、標準偏差を求めましょう。今ではエクセルで簡単に、平均や標準偏差は求めることができます。
標準偏差は、正規分布がどれだけ平べったいのか、とんがっているのかを示す値です。品質管理においては、とんがっていたほうが、バラツキが少なく安定した品質であると言えると思います。とんがっていれば、標準偏差の値は小さく、逆に大きければ平べったい分布となります。
中央値から1倍の標準偏差分、プラス方向とマイナス方向に進んだ範囲内に入る全体に対する比率は、約68%程度なので、約2/3。
2倍の標準偏差分、プラス方向とマイナス方向に進んだ範囲内に入る全体に対する比率は、95.45%なので、ほぼ入る。
3倍の標準偏差分、プラス方向とマイナス方向に進んだ範囲内に入る全体に対する比率は、99.73%なので、逆に入らない方が、0.27%の確率と大変珍しいことになります。
この世は正規分布だけでない
上記は、わかりやすいように正規分布で説明しましたが、この世は正規分布であるほうが、珍しいです。それは、たくさんの要因がデータには含まれているからです。
はじめに、20歳の男性1000人の身長の話をしましたが、その中に、日本人だけでなく、一定量以上の東南アジアの人だったり、白人系の人が入っていれば、それは違う要素なので、正規分布から外れる要因になり得ます。
しかし、はじめはそんなことがわからないので、まずはヒストグラムを作成して山が一つなのか、複数あるのか? とんがっている山なのか? 平べったい山なのか? を見てみる必要があります。
Excelでヒストグラムの作成方法
以下にエクセルでのヒストグラムを作成する方法を記載します。
まず開発タブを開いて、Excelアドインを選択します。
以下のWindowが立ち上がるので、分析ツールにチェックをしてOKを押します。
データタブにデータ分析が現れます。
例として、ある国の男の年齢をデータ化しておきました。添付のExcelを開いてください。
Excelを開いたら、560行目から563行目を確認してみてください。
まず、データの最大値と最小値を調べております。その差を確認して、刻む区間幅を計算します。
区間は20区間~40区間の間が良いと思います。今回は、30区間にしたいと思ったので、最大値91ー最小値0=91 を 30で割って、3.033を整数にして3が区間幅となります。
Excelの565行目に最小値をおいて、区間幅である3毎に、以下のセルに足していって、最大値が含まれる部分まで下にコピーします。
これで、ヒストグラムを作成する準備ができました。データ分析を押してください。以下のWindowが開きます。
ヒストグラムを選択してOKボタンを押すと、さらに、以下のWindowが立ち上がるので、
入力範囲(I)にその国の男の人の年齢を全部入るように範囲をいれます。
データ区間(B)に0から3毎に足していった、横軸になる部分を範囲設定します。この場合にはB565:B596 です。
グラフ作成(C)にチェックをつけて、新規ワークシート(P)を選択しておいてください。
新たなシートが作成され、A列に区間範囲と、B列にその中に該当する個数が入ります。また、グラフが作成されていると思います。
グラフを加工してみる。自動でできたグラフが以下です。
グラフの大きさを大きくして、データ系列の書式設定で棒グラフの重なり幅を3%程度に縮めると
よく見るヒストグラムのような感じになったと思います。
少し、分析をすると、48歳と72歳に山があることがわかります。3歳から33歳まで人口の割合が安定していることがわかります。よくよく調べてみると、第一次ベビーブームと第二次ベビーブームがあったのだとわかるというように分析できます。
コメント