何日か前からお知らせしている自作アクセス解析まわりのあれこれですが、その解析結果を載せるページを作っていませんでした。今日はそのあたりを中心に作りこみ、ようやくすべてが完成しました。
日刊ランキング - http://www.trash-news.net/rank/
なんと日刊 毎日アクセス解析のデータを集計して毎日ログを吐いていきます。検索エンジンでもないのに毎日検索ランキングをTOP100まで掲載するという ホント無用の長物!
以下仕様を。
解析対象のエンジンを4つに絞ったのはこれだけで95%のアクセスをまかなえてしまうからで BIGLOBEとかniftyは頑張れとしか。
このプログラムでキモでありガンとなりうるのはページタイトル取得の部分で、ここがネットワーク通信の問題で時間を食ったり負荷が高まったりするのが怖くてたまりません。Core Serverには頑張れとしか。
TRASH-NEWSはMovableType4(現段階で最新版の4.01)を利用しているのですが、困ったエラーがちょこちょことあるので困り者です。たとえばダブルクォーテーションを"の"ではなく“の“と変換したり、エントリーのbase_nameの"_(アンダーバー)"を勝手に"-(ハイフン)"に変換したり 早い話がMovableTypeには頑張れとしか。
そしてその前にページの作成ばかりで記事を書かない俺はもっと頑張れと(以下略)
[追記]夜の時間帯はどうもタイムアウトの制限が厳しかったりそもそもソケット通信ができなかったり(!?)するみたいなのでcronでページのタイトルを自動取得する機能は現在暫定的に止めています。昼間はふっつーにサックリ動いてたんだけどなぁ なんなんだよこの差は orz。サーバー側の改善を待つか、ソケット通信のタイムアウト設定を超短くするか(1秒とかで通信が完了するのだろうか)、どっちにせよ精神衛生上良くないのは間違いないですねー。
2008年11月23日 0時更新
| 日 | 月 | 火 | 水 | 木 | 金 | 土 |
|---|---|---|---|---|---|---|
| - | 11月 » | |||||
| 1 | 2 | 3 | 4 | 5 | 6 | |
| 7 | 8 | 9 | 10 | 11 | 12 | 13 |
| 14 | 15 | 16 | 17 | 18 | 19 | 20 |
| 21 | 22 | 23 | 24 | 25 | 26 | 27 |
| 28 | 29 | 30 | 31 | |||
