Previous     Next

『 Excel 統計超入門 』
第 2 回「度数分布とヒストグラムで見るデータの分布」
by 医学部数学講座
ch05.xls  


1. 度数分布表の作り方

階級 階級値 度数 累積度数 相対度数 累積相対度数
a1 〜 b1 x1 f1 F1 f1 / N F1 / N
a2 〜 b1 x2 f2 F2 f2 / N F2 / N
an 〜 bn xn fn Fn fn / N Fn / N
−− N −− 1 −−


ここで, 階級値 xi = ( ai + ai+1 ) / 2
度数 fi = 階級 ai 〜 bi のデータの個数
累積度数 Fi = f1 + f2 + … + fi
相度数 fi / N = 度数 / 全データ数
累積相対度数 Fi / N
☆ 階級の決め方と注意点

  1. 階級数を決める. 決め方には次のような基準がある.

    sqrt( N ) + 1

    log2( N ) + 1
        ( スタージェスの公式 )
    N 50 100 200 1000 10000
    sqrt(N) + 1 8.1 11 15.1 32.6 101
    log2(N) + 1 6.6 7.6 8.6 11.0 14.3
    簡単に 5〜7 8〜12 10 〜 20


  2. データの最大値と最小値を求め, 階級の幅を決める.
        階級の幅 = ( 最大値 - 最小値 ) / 階級数

  3. 階級の端はデータより 1 桁多くする.

Excelでは,

[挿入] [関数] [統計] [FREQUENCY]

を選び, データ配列 と 区間配列(階級の上限の列)  を入力した後、

[OK] [F2キー] ⇒ “Ctrl + Shift + Enter



2. ヒストグラムの作り方

度数分布をグラフ表現したものがヒストグラムであり,
  1. データの分布状況の把握,“対称形? 正規分布 ? etc.”
  2. 飛び離れたデータの検出
などが視覚的に簡単に行われる.
Previous     Next