| |
607 |
多断層別分析プログラム |
| |
|
| |
多段層別分析プログラムは、目的変数が連続量のとき、この目的変数を最大にする |
|
| |
2分割の展開を求めるときに使用します。 |
|
| |
|
|
| |
 |
| |
|
|
| |
↑クリックすると、インフォカートの決済画面に移ります。 |
|
| |
| |
| |
操作画面は次の通りです。 |
|
| |
|
|
|
|
|
|
|
|
|
|
| |
|
|
|
青色 |
説明変数データ範囲として、ドラッグして選択する。 |
| |
 |
|
|
|
|
| |
|
|
黄色 |
目的変数データ範囲として、ドラッグして選択する。 |
| |
|
|
|
|
| |
|
|
出力先 |
出力を開始したいセル1か所をクリックして選択。 |
| |
|
|
|
|
| |
|
|
属性要素の制限数の設定 |
|
|
| |
|
|
|
半角数字で入力します。 |
| |
|
|
|
|
| |
|
|
分析する最低レコード数 |
|
|
| |
|
|
|
半角数字で入力します。 |
| |
|
|
|
|
| |
|
|
中間出力 |
|
|
| |
|
|
|
有無について、クリックして選択します。 |
| |
|
|
|
|
| |
|
|
展開図作成 |
|
|
| |
|
|
有無について、クリックして選択します。 |
| |
|
|
|
| |
|
開始 |
設定が済んだら、「開始」をクリックします。 |
| |
|
|
|
| |
|
|
| |
|
| |
サンプルデータ |
| |
年齢 |
身長 |
職業 |
年収 |
来店率 |
|
| |
B |
A |
SM |
C |
10 |
|
| |
B |
D |
OL |
C |
10 |
|
| |
C |
D |
OL |
A |
20 |
|
| |
A |
C |
SM |
C |
30 |
|
| |
A |
C |
SM |
D |
20 |
|
| |
C |
B |
OL |
D |
20 |
|
| |
B |
D |
SM |
D |
10 |
|
| |
A |
A |
SM |
D |
30 |
|
| |
C |
B |
OL |
A |
10 |
|
| |
|
| |
|
| |
【分析結果】 (実際のプログラムは、罫線などは表示されません。) |
| |
|
| |
多段層別分析結果 |
| |
中間結果 |
| |
年齢 |
身長 |
職業 |
年収 |
摘要 |
|
| |
26.6667 |
20 |
15 |
15 |
平均値1 |
|
| |
10 |
15 |
20 |
16.6667 |
平均値2 |
|
| |
16.6667 |
25 |
0 |
20 |
平均値3 |
|
| |
0 |
13.3333 |
0 |
0 |
平均値4 |
|
| |
237.037 |
9.8765 |
30.8642 |
15.4321 |
SB1 |
|
| |
181.482 |
15.4321 |
24.6914 |
3.7037 |
SB2 |
|
| |
3.7037 |
104.321 |
0 |
19.7531 |
SB3 |
|
| |
0 |
59.2593 |
0 |
0 |
SB4 |
|
| |
422.222 |
188.889 |
55.5556 |
38.8889 |
TSB |
|
| |
66.6667 |
200 |
100 |
50 |
SE1 |
|
| |
0 |
50 |
400 |
266.667 |
SE2 |
|
| |
66.6667 |
50 |
0 |
200 |
SE3 |
|
| |
0 |
66.6667 |
0 |
0 |
SE4 |
|
| |
133.333 |
366.667 |
500 |
516.667 |
TSE |
|
| |
0.7805 |
0.0471 |
0.2358 |
0.2358 |
(SB/ST)1 |
|
| |
0 |
0.2358 |
0.0581 |
0.0137 |
(SB/ST)2 |
|
| |
0.0526 |
0.676 |
0 |
0.0899 |
(SB/ST)3 |
|
| |
0 |
0.4706 |
0 |
0 |
(SB/ST)4 |
|
| |
0.76 |
0.34 |
0.1 |
0.07 |
TSB/TST |
|
| |
|
| |
最初の選択(1) |
|
|
| |
年齢 |
身長 |
職業 |
年収 |
摘要 |
|
| |
3 |
2 |
4 |
2 |
グループ1 |
|
| |
3 |
2 |
5 |
3 |
グループ2 |
|
| |
3 |
2 |
|
4 |
グループ3 |
|
| |
|
3 |
|
|
グループ4 |
|
| |
| |
まとめ |
前項目 |
現項目 |
要素名 |
個数 |
来店率の計 |
|
| |
1 |
全体 |
年齢 |
A |
3 |
80 |
|
| |
1 |
全体 |
年齢 |
B |
3 |
30 |
|
| |
1 |
全体 |
年齢 |
C |
3 |
50 |
|
| |
|
| |
年齢 |
身長 |
職業 |
年収 |
摘要 |
|
| |
|
30 |
26.6667 |
30 |
平均値1 |
|
| |
|
25 |
20 |
25 |
平均値2 |
|
| |
|
11.1111 |
0 |
11.1111 |
SB1 |
|
| |
|
5.5556 |
222.222 |
5.5556 |
SB2 |
|
| |
|
120.988 |
222.222 |
36.4198 |
TSB |
|
| |
|
0 |
66.6667 |
0 |
SE1 |
|
| |
|
50 |
400 |
50 |
SE2 |
|
| |
|
50 |
66.6667 |
50 |
TSE |
|
| |
|
0.0471 |
0 |
0.2358 |
(SB/ST)1 |
|
| |
|
0.1 |
0.3571 |
0.1 |
(SB/ST)2 |
|
| |
|
0.7076 |
0.7692 |
0.4214 |
TSB/TST |
|
| |
|
| |
次の選択(2) |
|
|
| |
年齢 |
身長 |
職業 |
年収 |
摘要 |
|
| |
|
1 |
3 |
1 |
グループ1 |
|
| |
|
2 |
5 |
2 |
グループ2 |
|
| |
|
| |
年齢 |
身長 |
職業 |
年収 |
摘要 |
|
| |
|
10 |
|
10 |
平均値1 |
|
| |
|
10 |
|
10 |
平均値2 |
|
| |
|
0 |
|
0 |
SB1 |
|
| |
|
0 |
|
0 |
SB2 |
|
| |
|
104.321 |
|
19.7531 |
TSB |
|
| |
|
0 |
|
0 |
SE1 |
|
| |
|
0 |
|
0 |
SE2 |
|
| |
|
0 |
|
0 |
TSE |
|
| |
|
0.0471 |
|
0.2358 |
(SB/ST)1 |
|
| |
|
0.1 |
|
0.1 |
(SB/ST)2 |
|
| |
|
0.7076 |
|
0.4214 |
TSB/TST |
|
| |
|
| |
次の選択(3) |
|
|
| |
年齢 |
身長 |
職業 |
年収 |
摘要 |
|
| |
|
1 |
|
2 |
グループ1 |
|
| |
|
2 |
|
1 |
グループ2 |
|
| |
|
| |
年齢 |
身長 |
職業 |
年収 |
摘要 |
|
| |
|
|
|
15 |
平均値1 |
|
| |
|
|
|
20 |
平均値2 |
|
| |
|
|
|
5.5556 |
SB1 |
|
| |
|
|
|
11.1111 |
SB2 |
|
| |
|
|
|
36.4198 |
TSB |
|
| |
|
|
|
50 |
SE1 |
|
| |
|
|
|
0 |
SE2 |
|
| |
|
|
|
50 |
TSE |
|
| |
|
|
|
0.1 |
(SB/ST)1 |
|
| |
|
|
|
0.1 |
(SB/ST)2 |
|
| |
|
|
|
0.4214 |
TSB/TST |
|
| |
|
| |
次の選択(4) |
|
|
| |
年齢 |
身長 |
職業 |
年収 |
摘要 |
|
| |
|
|
|
2 |
グループ1 |
|
| |
|
|
|
1 |
グループ2 |
|
| |
| |
まとめ |
前項目 |
現項目 |
要素名 |
個数 |
来店率の計 |
|
| |
2 |
年齢 |
職業 |
SM |
3 |
80 |
|
| |
2 |
年齢 |
身長 |
A |
1 |
10 |
|
| |
2 |
年齢 |
身長 |
D |
2 |
20 |
|
| |
2 |
年齢 |
年収 |
A |
2 |
30 |
|
| |
2 |
年齢 |
年収 |
D |
1 |
20 |
|
| |
| |
展開図 ( 要素の制限数= 51 ) |
|
来店率の計 |
|
| |
全体 |
年齢 |
C |
3 |
|
|
50 |
|
| |
|
|
年収 |
D |
1 |
|
20 |
|
| |
|
|
年収 |
A |
2 |
|
30 |
|
| |
|
年齢 |
B |
3 |
|
|
30 |
|
| |
|
|
身長 |
D |
2 |
|
20 |
|
| |
|
|
身長 |
A |
1 |
|
10 |
|
| |
|
年齢 |
A |
3 |
|
|
80 |
|
| |
|
|
職業 |
SM |
3 |
|
80 |
|
| |
| |
| |
【解説】 |
分析方法は以下のとおりです。 |
| |
|
| |
1) 説明変数Xが量であるとき、2分割(n1、n2)を行う。 |
| |
a |
説明変数Xの昇順ソートを実行 |
| |
ただし、説明変数の同位順位がある場合は |
| |
説明変数Xの昇順ソートと目的変数の昇順ソート |
| |
F0=(ya1-ya2)^2/(V*(1/n1+1/n2)) |
| |
V=(S11+S22)/(n1+n2-2) |
| |
ここで、 |
| |
S11=Σ(yi-ya1)^2 |
i=1...n1 |
|
| |
S22=Σ(yi-ya2)^2 |
i=1...n2 |
|
| |
ya1=Yのn1個の平均 |
|
| |
ya2=Yのn2個の平均 |
|
| |
b |
F0が最大になるn1、n2を求める。 |
| |
|
|
| |
2) 同様に、他の説明変数についても、F0を計算し、分割する。 |
|
| |
x1 |
x2 |
x3 |
… |
Xm |
|
| |
n11、n12 |
n21、n22 |
n31、n32 |
… |
nm1,nm2 |
|
| |
| |
3) F0が最大である説明変数を求める。 |
|
| |
この時の説明変数をXpとする。 |
|
| |
| |
4) Xpの分割数 p1、p2 について、次の変動を計算する。 |
|
| |
F=SB/STを計算する。 |
|
| |
SB=p1*(Yap1-Ya)^2+p2*(Yap2-Ya)^2 |
|
| |
ST=Σ(Yi-Ya)^2 |
|
| |
Yap1=Yのp1個の平均 |
|
| |
Yap2=Yのp2個の平均 |
|
| |
Ya=Yの(p1+p2)個の平均 |
|
| |
| |
5) Fが大きい方の分割数を次の分割の範囲(データ)数として、1から4の分割を繰返す。 |
|
| |
即ち、グループ内変動誤差とグループ間の変動誤差から、分岐項目を選択する。 |
|
| |
| |
参考) |
|
| |
割合[r] |
情報量(-r*log[r]) |
|
| |
0.5 |
0.5 |
計 |
|
| |
0.5 |
0.5 |
1 |
|
| |
| |
0.2 |
0.46439 |
|
| |
0.3 |
0.52109 |
計 |
|
| |
0.5 |
0.5 |
1.48548 |
|
| |
| |
0.1 |
0.33219 |
|
| |
0.2 |
0.46439 |
|
| |
0.3 |
0.52109 |
計 |
|
| |
0.4 |
0.52877 |
1.84644 |
|
| |
| |
| |
 |
|
| |
|
| |
|
| |
↑クリックすると、インフォカートの決済画面に移ります。 |
|
| |
| |
| |
●特定商取引法に基づく表記 |
|
| |
|
|
|
|
|
|
|
|
|
|
|
|
|
|