607 多断層別分析プログラム
   
  多段層別分析プログラムは、目的変数が連続量のとき、この目的変数を最大にする  
  2分割の展開を求めるときに使用します。  
     
  ご購入はこちらからどうぞ
     
  ↑クリックすると、インフォカートの決済画面に移ります。  
 
 
  操作画面は次の通りです。  
                     
        青色 説明変数データ範囲として、ドラッグして選択する。
         
      黄色 目的変数データ範囲として、ドラッグして選択する。
         
      出力先 出力を開始したいセル1か所をクリックして選択。
         
      属性要素の制限数の設定    
        半角数字で入力します。
         
      分析する最低レコード数    
        半角数字で入力します。
         
      中間出力    
        有無について、クリックして選択します。
         
      展開図作成    
      有無について、クリックして選択します。
       
    開始 設定が済んだら、「開始」をクリックします。
       
     
   
  サンプルデータ
  年齢 身長 職業 年収 来店率  
  B A SM C 10  
  B D OL C 10  
  C D OL A 20  
  A C SM C 30  
  A C SM D 20  
  C B OL D 20  
  B D SM D 10  
  A A SM D 30  
  C B OL A 10  
   
   
  【分析結果】 (実際のプログラムは、罫線などは表示されません。)
   
  多段層別分析結果
  中間結果
  年齢 身長 職業 年収 摘要  
  26.6667 20 15 15 平均値1  
  10 15 20 16.6667 平均値2  
  16.6667 25 0 20 平均値3  
  0 13.3333 0 0 平均値4  
  237.037 9.8765 30.8642 15.4321 SB1  
  181.482 15.4321 24.6914 3.7037 SB2  
  3.7037 104.321 0 19.7531 SB3  
  0 59.2593 0 0 SB4  
  422.222 188.889 55.5556 38.8889 TSB  
  66.6667 200 100 50 SE1  
  0 50 400 266.667 SE2  
  66.6667 50 0 200 SE3  
  0 66.6667 0 0 SE4  
  133.333 366.667 500 516.667 TSE  
  0.7805 0.0471 0.2358 0.2358 (SB/ST)1  
  0 0.2358 0.0581 0.0137 (SB/ST)2  
  0.0526 0.676 0 0.0899 (SB/ST)3  
  0 0.4706 0 0 (SB/ST)4  
  0.76 0.34 0.1 0.07 TSB/TST  
   
  最初の選択(1)    
  年齢 身長 職業 年収 摘要  
  3 2 4 2 グループ1  
  3 2 5 3 グループ2  
  3 2   4 グループ3  
    3     グループ4  
 
  まとめ 前項目 現項目 要素名 個数 来店率の  
  1 全体 年齢 A 3 80  
  1 全体 年齢 B 3 30  
  1 全体 年齢 C 3 50  
   
  年齢 身長 職業 年収 摘要  
    30 26.6667 30 平均値1  
    25 20 25 平均値2  
    11.1111 0 11.1111 SB1  
    5.5556 222.222 5.5556 SB2  
    120.988 222.222 36.4198 TSB  
    0 66.6667 0 SE1  
    50 400 50 SE2  
    50 66.6667 50 TSE  
    0.0471 0 0.2358 (SB/ST)1  
    0.1 0.3571 0.1 (SB/ST)2  
    0.7076 0.7692 0.4214 TSB/TST  
   
  次の選択(2)    
  年齢 身長 職業 年収 摘要  
    1 3 1 グループ1  
    2 5 2 グループ2  
   
  年齢 身長 職業 年収 摘要  
    10   10 平均値1  
    10   10 平均値2  
    0   0 SB1  
    0   0 SB2  
    104.321   19.7531 TSB  
    0   0 SE1  
    0   0 SE2  
    0   0 TSE  
    0.0471   0.2358 (SB/ST)1  
    0.1   0.1 (SB/ST)2  
    0.7076   0.4214 TSB/TST  
   
  次の選択(3)    
  年齢 身長 職業 年収 摘要  
    1   2 グループ1  
    2   1 グループ2  
   
  年齢 身長 職業 年収 摘要  
        15 平均値1  
        20 平均値2  
        5.5556 SB1  
        11.1111 SB2  
        36.4198 TSB  
        50 SE1  
        0 SE2  
        50 TSE  
        0.1 (SB/ST)1  
        0.1 (SB/ST)2  
        0.4214 TSB/TST  
   
  次の選択(4)    
  年齢 身長 職業 年収 摘要  
        2 グループ1  
        1 グループ2  
 
  まとめ 前項目 現項目 要素名 個数 来店率の  
  2 年齢 職業 SM 3 80  
  2 年齢 身長 A 1 10  
  2 年齢 身長 D 2 20  
  2 年齢 年収 A 2 30  
  2 年齢 年収 D 1 20  
 
  展開図 ( 要素の制限数= 51 )   来店率の計  
  全体 年齢 C 3     50  
      年収 D 1   20  
      年収 A 2   30  
    年齢 B 3     30  
      身長 D 2   20  
      身長 A 1   10  
    年齢 A 3     80  
      職業 SM 3   80  
 
 
  【解説】 分析方法は以下のとおりです。
   
  1) 説明変数Xが量であるとき、2分割(n1、n2)を行う。
  a 説明変数Xの昇順ソートを実行
  ただし、説明変数の同位順位がある場合は
  説明変数Xの昇順ソートと目的変数の昇順ソート
  F0=(ya1-ya2)^2/(V*(1/n1+1/n2))
  V=(S11+S22)/(n1+n2-2)
  ここで、
  S11=Σ(yi-ya1)^2 i=1...n1  
  S22=Σ(yi-ya2)^2 i=1...n2  
  ya1=Yのn1個の平均  
  ya2=Yのn2個の平均  
  b F0が最大になるn1、n2を求める。
     
  2) 同様に、他の説明変数についても、F0を計算し、分割する。  
  x1 x2 x3 Xm  
  n11、n12 n21、n22 n31、n32 nm1,nm2  
 
  3) F0が最大である説明変数を求める。  
  この時の説明変数をXpとする。  
 
  4) Xpの分割数 p1、p2 について、次の変動を計算する。  
  F=SB/STを計算する。  
  SB=p1*(Yap1-Ya)^2+p2*(Yap2-Ya)^2  
  ST=Σ(Yi-Ya)^2  
  Yap1=Yのp1個の平均  
  Yap2=Yのp2個の平均  
  Ya=Yの(p1+p2)個の平均  
 
  5) Fが大きい方の分割数を次の分割の範囲(データ)数として、1から4の分割を繰返す。  
    即ち、グループ内変動誤差とグループ間の変動誤差から、分岐項目を選択する。  
 
  参考)  
  割合[r] 情報量(-r*log[r])  
  0.5 0.5  
  0.5 0.5 1  
 
  0.2 0.46439  
  0.3 0.52109  
  0.5 0.5 1.48548  
 
  0.1 0.33219  
  0.2 0.46439  
  0.3 0.52109  
  0.4 0.52877 1.84644  
 
 
   
   
   
  ↑クリックすると、インフォカートの決済画面に移ります。  
 
 
  ●特定商取引法に基づく表記