あれ?

2888人分しか無いよ? 同村係数勘違いしていたからもう一度やり直しだよ。多い方が分子か。騙された。
hatenadiaryは被登録アンテナリストから抜いてあります。
idは自分自身も比較対象自身もカウント。そこの排他処理面倒臭い。
データの形式は

比較対象id,重複数,同村指数,同村指数2,比較対象idの被登録アンテナ数

に変更。なるべく融通利くようにしとく。
同村指数2は式に書くと以下の通り。logの底はe*1で。

  • m:重複数
  • a:hatenadiaryを除いた自分自身の被登録アンテナ数
  • b:hatenadiaryを除いた比較対象idの被登録アンテナ数

とすると、下の通り。
[tex:Douson2 = 100**2*(log(a/b))]

*1:自然対数

*2:m*2)/(a+b