似非と現実の日記@?D 2004/05/19 第四回日記名調査ですが
実際には下にも書いたとおり元データを修正する必要があるのだけれども面倒臭いのでやってません(藁 パブリックもプライベートも纏めてやってます。分けたデータ無いし。
で、下の様に正規表現書けば数字関係とID関係は出ますよ。

ということで第四回期待してます。アナライザを増やすのですヽ( ´ー`)ノ

5月18日2時時点ではてなダイアリーアンテナに登録されているサイトは44329件(うち1件だけはてなダイアリでは無い。またデータ中7箇所カンマが抜けているのが面倒臭い)

  • IDがタイトルに入っている日記は15848件
    • ^LIRS.*http://d.hatena.ne.jp/\([0-9a-zA-Z-_]+\)/,.*\1.*,\1,http://a.hatena.ne.jp/,,$
    • ついでに「IDの日記」というタイトルの日記は13426件
  • タイトルに数字が入っている日記は3635件
    • ^LIRS.*http://d.hatena.ne.jp/\([0-9a-zA-Z-_]+\)/,.*[0-9]+.*,\1,http://a.hatena.ne.jp/,,$
  • IDに数字が入っていない且つIDがタイトルに入っている日記は13163件
    • ^LIRS.*http://d.hatena.ne.jp/\([a-zA-Z-_]+\)/,.*\1.*,\1,http://a.hatena.ne.jp/,,$