以下の3手法に関しては次の式を用いて計算します。
dxc = αadxa + αbdxb + γ| dxa - dxb |
・最短距離法(最近隣法)[αa:0.5,αb:0.5,γ:-0.5]
dxc = 0.5dxa + 0.5dxb
- 0.5| dxa - dxb |
・最長距離法(最遠隣法)[αa:0.5,αb:0.5,γ:0.5]
dxc = 0.5dxa + 0.5dxb
+ 0.5| dxa - dxb |
・群平均法[αa:na/nc,αb:nb/nc,γ:0]
dxc = (na/nc)dxa
+ (nb/nc)dxb
+ 0.5| dxa - dxb |
以下の4式には次の式を用いて計算します。
dxc |
2 |
= αadxa | 2 | + αbdxb | 2 | + βdab | 2 |
・メディアン法 [αa:0.5,αb:0.5,β:-0.5]
dxc |
2 |
= 0.5dxa | 2 | + 0.5dxb | 2 | + 0.25dab | 2 |
dxc |
2 |
= (na/nc)dxa | 2 | + (nb/nc)dxb | 2 | -((nanb)/nc | 2 | )dab | 2 |
dxc |
2 |
= ((nx+na)/(nx+nc))dxa | 2 | + ((nx+nb)/(nx+nc))dxb | 2 | + (nx/(nx+nc))dab | 2 |
dxc |
2 |
= ((1-β)/2)dxa | 2 | + ((1-β)/2)dxb | 2 | + βdab | 2 |
数式内の na はクラスターa
に含まれる要素数を示しています。nb, nc, nx も同様です。
また、可変法内のβは1未満の任意の値を指定します。
ここでは最短距離法を用いてクラスター分析のアルゴリズムを説明していきたいと思います。
このページではクラスター分析プログラムを作るという観点から説明をしています。
こちらではアルゴリズムそのものについて説明しています。
アルゴリズムそのものにはあまり触れないので、分からない部分はアルゴリズムのページも見るいいかと思います。
|
||||||||||||||||||||||||||||||||||||||||
↓
|
||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||
↓
|
||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||
↓
|
||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||
↓
|
||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||
↓
|
||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||
↓
|
||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||
↓
|
||||||||||||||||||||||||||||||||||||||||
|