2003-10-13から1日間の記事一覧

解析終了

終わったのは二時間ほど前。しかし回線の調子悪すぎ。55MBのファイルをアップすることが不可能である。 学校ならと思ったがftpのポートが利用出来ない。 てことはネットカフェか。参ったな。 明日の四時頃からCD-ROM持って回るか。しんど。

ずれる理由判明

大文字と小文字の区別か! FujikoさんとfujikoさんとかTomoyaさんとtomoyaさんがいるんだね。 よし分かった。もう一回Grep置換してから計測するぞ。

同村指数計測完了寸前

重複数記録し損ねました。もう知りません。 sugio氏@id:sugioの計測データとの間に誤差があるのは仕様です。理由は2003/10/13 あれ?に書いてあるように計算方法がちょっと違うのです。 とりあえず俺のデータから上位10名を並べてみると以下の通り。 id:puput…

あれ?

2888人分しか無いよ? 同村係数勘違いしていたからもう一度やり直しだよ。多い方が分子か。騙された。 hatenadiaryは被登録アンテナリストから抜いてあります。 idは自分自身も比較対象自身もカウント。そこの排他処理面倒臭い。 データの形式は 比較対象id,…

データ処理

何とか2897人分出来そうです。後はid.csvというファイルを書き出す様にするだけ。出来たら2897+1ファイル配布しますですよ。 id.csvの中に、 比較対象id,同村指数,比較対象idの被登録アンテナ数 ってのをずらずら並べようと思ってます。 filelist.txtの方に…

データ解析用

@array1と@array2を比べて同じものだけ抜き出すとかそういうことは無理か。無理なのか。foreachで繰り返しですか。 list.txtの長さをnとしてxxx.datの項目数の最大値をMとすると、 想定計算stepはO(n^2*M^2)か? 上手く組めば半分位にゃなる筈なんだが。

データ解析用

ようやくデータ解析用のplファイルを書き始める。 今まで一度もperlを書いたことが無いという点がポイント。 適当なディレクトリにdelete.txtと一緒に突っ込むとdelete.txt中のファイルを全部消去するplファイルと適当なディレクトリに突っ込んだらそのディ…