QC検定3級に出てくる基本統計量の式をまとめてみました。QC検定を受験される方のお役に立てれば幸いです。式がたくさん出てきますが、簡単なものばかりなので必ず覚えてお入れください。
なお、QC検定の勉強に役立つ記事はコチラにまとめておりますので、併せてご活用ください。
データの”真ん中”を表す表現
データにはいろいろな”真ん中”があります。
データの真ん中を表す、「平均値」「中央値(メディアン)」「最頻値(モード)」の考えた方とその式をまとめてみます。
平均値(mean)
平均値はデータの値をすべて足してデータ数で割った値です。
極端に「大きい」もしくは「小さい」値の影響を受けやすいです。
以下の式で表すことが出来ます。
中央値(median)
中央値(メディアン)はすべてのデータを値の大きさ順に並べたときに”真ん中”にある値です。極端に「大きい」もしくは「小さい」値の影響を受けにくいです。
以下の式によってあらわすことが出来ます。
(1)データが偶数個の時
(2)データが奇数個の時
最頻値(mode)
最頻値(モード)は最も登場回数の多い値のことを指します。
極端に「大きい」もしくは「小さい」値の影響を受けにくいです。
範囲(R)とは
データの中で、最大値と最小値の差のことです。以下の式で表されます。
平方和(S)とは
個々の測定値(データ)と平均値との差(偏差)の2乗の和のことです。偏差平方和とも言います。以下の式で表されます。
【参考】
- 偏差とはデータの値と平均値との差を表しており、「平均値からどれだけ離れているか」を示す値です。偏差を利用すればデータの「ばらつき」を表すことが出来ます。
- 偏差を足せばデータ全体の「ばらつき」が定量的に表せるように思えます。しかしながら、偏差には「正の値」と「負の値」が存在します。ですから、単純に足した場合、バラつきが大きくても偏差の和は小さくなってしまうことがありえます。
- この現象を排除するには「偏差を2乗してやる」という方法があります。2乗すればすべてのデータは「正の値」になります。この値(偏差の平方値)を合計を平方和(偏差平方和)と言います。こうすれば「ばらつき」を的確に表現できます。
- 平方和をデータ数で割ったものが「分散(標本分散)」です。しかしながら、統計学の分野では後述する不偏分散の方がよく用いられます。
不偏分散(V)とは
不偏分散(不偏標本分散)とは平方和(S)をデータ数(n)から1引いた数で割ったものです。データ全体の「ばらつき」を表現できる数値です。以下の式によってあらわされます。
標準偏差(s)とは
分散は偏差の二乗したものを利用して計算しているため、単位が元のデータと変わってしまっています。つまり、単位も二乗されているのです。
このことに注意が必要です。
この問題を解決するために用いられるのが分散の平方根「標準偏差」です。
分散の平方根(標準偏差)を計算することで、以下のメリットがあります。
- 単位を元に戻す事ができる
- 平均値に対してどの程度離れているかを示す指標になる(偏差の基準になる値)。
標準偏差は以下の式によってあらわすことが出来ます。
変動係数(CV)とは
変動係数は標準偏差を平均で割ったものです。
求めた変動係数が大きければ「ばらつきが大きい」と判断することができます。
まとめ
(1)平均値
(2)範囲
(3)平方和
(4)不偏分散
(5)標準偏差
(6)変動係数
(7)真ん中を示す各種用語の意味を覚えておこう
- 平均値
- 中央値(メディアン)
- 最頻値(モード)
この記事で利用した主な参考文献
![]() |
|
![]() |
|