様々な学問/勉強課目を図解/アニメーション化したり、シミュレーションツールを用いて楽しく分かりやすく解説するサイトです!
⇒ 本ブログの詳細/連絡先はコチラ!
⇒ 本ブログは複数テーマ(色)を持つ階層構造になってます!
学問TOP 数学 経済学/投資 統計学/確率 物理学
  1. ホーム
  2. 〇学問/勉強
  3. 統計学/確率
  4. 平均/分散等の代表値
  5. 統計学/確率入門:データのバラつき(分散/標準偏差)とは何か?をシミュレーターを用いて詳しく解説!実験で深く理解しよう!
■注目記事一覧

本サイトの「サイコロ シミュレーター」が熊本の特別教育テレビ授業で使われました!

運動量保存の法則をwebシミュレーションで解説!

コンピューターの全理基礎:半加算器の原理をシミュレーターで理解しよう!

倍プッシュ(マーチンゲール法)シミュレーションツール!必勝法 倍プッシュの欠点とは!?

なぜ賭け/投資(株式/FX)市場はほとんどの人が勝てないのか?シミュレーションで解説!

なぜ全力買い(全額投資)はダメなのか?シミュレーション交えて解説!

強者(資産家)が勝つ市場論理をシミュレーションツールで解説!
 
スポンサーリンク
Twitter(更新情報)

統計学/確率入門:データのバラつき(分散/標準偏差)とは何か?をシミュレーターを用いて詳しく解説!実験で深く理解しよう!

$$\newcommand\CB[1]{\textcolor{blue}{#1}} \newcommand\CR[1]{\textcolor{red}{#1}} \newcommand\CG[1]{\textcolor{magenta}{#1}}$$

統計学/確率の内容をシミュレーターで分かりやすく詳しく解説していきます!

本サイトでは、数学分野の内容を基礎から分かりやすくシミュレーターを用いて解説しています!このベースを用いて、以後「統計学/確率」の分野の内容を同様にシミュレーターを作って解説していきたいと思います!
 
前回までの記事では統計上一番重要な、「平均値」「中央値」の説明をしてきました。これは統計データの「真ん中」を表す概念でした。

それに対して、もう一つ統計学上大事な概念があります。それが「データのバラつき」です。そして、それを表すのが「分散」「標準偏差」という代表値です。本記事では、データのバラつきの意味と「分散」「標準偏差」の定義とイメージを詳しく解説していきます!

データの「バラつき」とは、、、まずは体感してみよう!

「バラつき」とは何か。それは、どれだけ各データの数値が乱雑になっていてバラついているか、ということです。テスト結果でいうと、みんなが50点であればバラついてないし、皆が40点~60点付近であればある程度バラついていると言えるし、さらに0点の人も多くいて100点の人も多くいる状態であればかなりバラついている、、と言えます。曖昧ですが、そんなイメージです。

シミュレーターで「データのバラつき」を体感して、イメージを掴もう!

上のような曖昧な説明だと分かりにくいので、シミュレーターを使って「データのバラつき」を体感してみましょう!
 
↓のスライドバーを動かすとシミュレーターが動きます。スライドバーの乱雑度の数値によって、「バラつき」具合を変えられます。データは50を中心にして出力されます。

バラつきが0から最大限まで変えてみて、「バラつき」を体感してみて下さい!

乱雑度
10

データのバラつきのイメージ

上記のシミュレーターで大体理解できたかと思いますが、各乱雑度での結果のおさらいをしていきます。

[乱雑度=0]

[乱雑度=5]

[乱雑度=20]

この結果を見ると、乱雑度が高くなるほど中心から離れた数値が多くなる傾向にあることが分かります。つまり、「中心からどれだけ離れているか」を数値化できれば、「データのバラつき」が表わせそうですね!
 

データのバラつきを表す代表値「分散」「標準偏差」

上記の考察の通り、「中心からどれだけ離れているか」を表現できればデータのバラつき度合いを数値で示せそうですね。そこで下図のように「全データに対して、平均値からどれぐらい離れているか」を求めることを考えます。赤い線が平均値で、紫の線がその平均値との差です。この紫の線の長さでバラつきが表わせそうですね!この線の長さの平均値をとると、バラツキ具合が示せそうですね!


 
それでは、バラつきを数式化してみましょう!前回までと同様に以下のように記号を定義します。

n: テストを受けた人数(データ個数)
\(x_i\): i番目の人の点数

そして、平均値(\(\bar x \)とします)は前回記事で解説した通り、以下の式で表せます。

平均値の定義

\( 平均値 \bar x \)
\( \displaystyle = \frac{1}{n}(x_1 + x_2 + … + x_n) \)
\( \displaystyle = \frac{1}{n}\sum_{i=1}^{n}x_i \)

そうすると、上記でいっていた「平均値と各データ値との差異」の平均は以下の式で表せます。

\( データのバラつき度合い \)
\( \displaystyle = \frac{1}{n}\sum_{i=1}^{n}| \bar x – x_i| \)

このようになるんですが、、、数値計算上、絶対値の計算って面倒だったりするんですよね(マイナスとプラスで分岐して計算しないといけない)。そのため、\(| \bar x – x_i|\)を\((\bar x – x_i)^2\)に入れ替える事を考えます。これならマイナスプラスの記号が消えるので。そして、これこそが統計で非常に重要な指標である「分散」の定義になります。この分散は\(σ^2\)という記号で表すことが多いです。

分散の定義

\( 分散σ^2 \)
\( \displaystyle = \frac{1}{n}\sum_{i=1}^{n} (\bar x – x_i)^2 \)

この分散こそ、データのバラつきを表す指標値なのです!

しかし、一つ問題があります。記号を消すために分散は二乗しています。ですので、下図の紫矢印の長さの二乗の平均値になっているんですよね><

ということで、これを元の次元に戻すためにルートをとります。これが「標準偏差」です。標準偏差は分散のルートなので、\(σ\)という記号で表すことが多いです。

標準偏差の定義

\( 標準偏差σ \)
\( \displaystyle = \sqrt{\frac{1}{n}\sum_{i=1}^{n} (\bar x – x_i)^2} \)

 
この標準偏差を使うと、データがどれぐらいバラついているかが体感的に分かるのです!

大事なのは「分散」も「標準偏差」も、データのバラツキを表す代表値であるということです!ただ分散は標準偏差の二乗であり、次元が違うことに気をつけて下さい!

分散と標準偏差については後にその性質などを詳しく解説しますが、まずはこの意味合いを捉えることが重要です!

自分でシミュレーターに点数を入力していき、標準偏差の変動のイメージを掴もう!

シミュレーターの概要

ここまで解説した内容で分散と標準偏差の定義は理解できたと思います。しかし、実際にどんな数値になるのかイメージがつきにくいですよね><

そこで、数値を入力すると、リアルタイムに標準偏差の範囲を図示するシミュレーターを作りました!

今回もテストの結果を仮定して、0~100点までで値を入力できるようになっています。
入力したテスト点数により、平均値(赤線)標準偏差の範囲(緑枠)をリアルタイムに算出して表示します。
緑色の範囲が「標準偏差の範囲内」であり、平均的なデータよりも平均値に近いことを意味しています。逆に緑色の枠外は標準偏差外であり、平均的なデータよりも離れた位置にあることを意味しています!

↓シミュレーターのスクリーンショット。こんな感じで平均値と標準偏差をリアルタイムに図示します!

 

標準偏差計算シミュレーターを実際に動かしてみよう!

↓のスライドバーを動かすと、指/マウスを離した時点でその点数が追加されます!ポンポン押しながらデータを追加していき、平均値と標準偏差の変動を確かめて見ましょう!
* リセットボタンで初期化できます
* 右上のsdという値が実際の標準偏差の値です。この値を確かめながら実験してみましょう!


点数
50


 
データをバラついて配置すると標準偏差は広がっていきますし、データを同じようなところに置くと標準偏差は狭まっていきます。分散はこの標準偏差を二乗したものですので、その動きも同様です^^
 

次回は「偏差値」について解説します!

本記事では「データのバラつき」について解説しました。基本的に、データの中心である平均値からどれだけ離れているかがバラつきの指標であり、「各データと平均値との差異」の平均を考えていった結果に出てるのが「分散」と「標準偏差」です。この2つを見れば、どれぐらいデータがバラついているかが分かるんですね!
 
次回はこの2つを実践的に応用した概念である「偏差値」について解説します!偏差値はテストなどでよく聞く言葉ですよね。この偏差値、今回解説した標準偏差と強い関連があるんです!次回はこの「偏差値」について解説していきます!

統計学/確率入門:平均/分散等の代表値
1.平均値
2.中央値
3.分散、標準偏差 (本記事)
4.偏差値
5.度数分布表/階級

⇒「平均/分散等の代表値」カテゴリ記事一覧

その他関連カテゴリ

[関連コンテンツ]




お気軽にコメントお願いします!

Your email address will not be published.