タグ » awstats «

2010/02/08 月曜日 | 投稿者: aqua

こんばんは、aquaです。

前回ユーザビリティの改善のために各文言の和訳や表示順の入替などを実施した。この変更は図らずもページタイトルのフォーマットにも及ぶ事になった。基本的にはPVを上げるための施策だったが、結論から言うとPVは激減した。正確な因果関係は不明だが、状況としてはgoogleの検索結果順序が大きく落ち込んでしまった。やはりgoogleのクシャミ一つでネット上でのポジションが大きく変わるというのは相変わらずのようだ。以前に運用していたサイトも、この手の問題でやる気がなくなって実質凍結状態にした事を思い出した。他の誘導パス作りをさぼっていたのがいけないんだけどね。

そんな訳で、すっかりPVも減ってしまったので、今まで試せなかった実験的な変更を追加していく。主にSEO対策まとめ系のページを参考にした。カテゴリにシングル・バイトのスラッグを準備していたが、これを日本語に戻した。URL内の日本語がどういう意味を持つか怪しいものだが、とりあえず様子を見てみる。更に記事のURLも『/%year%/%monthnum%/%postname%/』から『/%category%/%postname%/』に変更した。この変更により記事ページのURLが世の中的には重複する事になるので、それを防ぐためのcanonical属性導入を考える。

canonical属性は、検索エンジンに任意の記事について正しいURLを認識させるために使用される。canonical属性の追加には幾つかのプラグインが用意されている。『All in One SEO Pack』を試してみたが、タイトルの変更も行われてしまう。タイトルを処理に任せると日付の表示が『YYYY MM月 DD』のようにイマイチになる。ここは手元で修正したので、canonical属性のみ対応してくれるプラグインに変更する。その名も『Canonical URL’s』。プラグインとしてのインストール以外は何も設定できないツールだが、期待通りきちんとcanonical属性の追加は行われている。

ここまで作業が完了したところで、『404 not found』がちょこちょこ起きている事に気付く。過去のスラッグに対するアクセスが404になっていた。直接『.htaccess』を修正しようかとも思ったが、それ用のプラグインである『Redirection』を発見したので、旧スラッグURLを新スラッグURLに転送するように設定。ここでふと気付いたのだが、外からawstatsへのアクセス可能になっている。awstatsは元々、狙い済ました直接アクセスが非常に多い。調べてみたところ、httpd.confにアクセスを許可する設定が追記されていた。以前にawstatsを再構築した際に、スクリプトか何かで入り込んだのだろう・・・、こわやこわや。

カテゴリ: 技術系  | タグ: , , , , ,  | コメント
2010/01/24 日曜日 | 投稿者: aqua

こんばんは、aquaです。

ここ最近のUU及びPVは右肩上がり。とは言っても元々が大したトラフィックではないけど。年末と正月の投稿ラッシュで誘導が増えたのかな。そんな訳で、前回もblogそのものを修正したのだが、今回はアクセスログ解析であるawstatsを久々に修正していく。awstatsはドメインごとに準備する『awstats.www.domain.com.conf』というファイルをカスタマイズする。まずは内輪からのトラフィックがノイズになりつつあるので、カウントしないように設定する。『SkipHosts』というパラメータにスペース区切りで必要なIPを記載する。正規表現も使える。今回は以下。

SkipHosts=”REGEX[^192\.168\.0] 123.234.56.254″

次に24時間に一度しか更新していなかったバッチを1時間ごとに変更する。最近のapacheのアクセスログはrotatelogsによって、日次でログファイルを分断する事が多い。その為、現在は昨日の日付になっているアクセスログを読み出す、という設定になっている。これを昨日のアクセスログと本日のアクセスログの両方を見るように修正する。本日のだけだと前日てのログが完成する24時の時点で解析してくれない事になるからだ。アクセスログのファイル指定は『LogFile』というパラメータに対して設定する。コマンドも使える。今回は以下。

LogFile=”cat /usr/local/apache/logs/access-%YYYY-24%MM-24%DD-24.log /usr/local/apache/logs/access-%YYYY%MM%DD.log|”

そして検索文字列の問題も検討する。googleなどからどのような検索文字列で誘導されたかをレポートしてくれるのだが、その際に全角スペースなどが使われてしまうと、それ前後の言葉と合わせて1語と判断されてしまい、ノイズになってしまう。ググってみると幾つか対応方法はありそうだが、今回は修正が簡単そうなこちらのページにあるパッチを当てる事にした。パッチ適用後に念のため全データをリフレッシュすると、検索文字列も妙な重複や文字化けが解消し、すっきりと期待通りに表示されるようになった。

最後は似たような問題で、ページ表示ランキングでよく見られたURLをまとめてくれるのだが、何故か同じページが幾つかに分かれてしまったり、そもそもURLEncodeされているため一見してどのページが分からない。このURLEncodeも変換出来ないか調べてみた。こちらのページにて、アクセスログのURLEncodeを変換するコマンドが準備されていたので利用してみたが効果なかった。自力で簡単な修正もしたが変化せず。設定ファイルをよく見ていくがそれらしきパラメータはない。しかし、偶然『URLNotCaseSensitive』というパラメータを見つけた。これを1に設定すると、URLの大文字小文字を無視して集計してくれる。400種類近かったURLが半分近くまで減って分かり易くなったので、今回はこれでよしとした。

カテゴリ: 技術系  | タグ: , ,  | コメント
2009/04/30 木曜日 | 投稿者: aqua

こんばんは、aquaです。

ブログを書き始めてから9ヶ月。どうせ途中で飽きるかと思っていたけど、意外にもまだ続いている。記事を書く度に、誘導キーワードが増えていき、PVが伸びるのがモチベーションに貢献している。その割りにさぼっていたのがPV解析だ。まあ趣味の範囲だし、SEOやら被リンク対策など何もしていないので、大して意味はないんだけど。一応、wordpress上で動作するStat Traqというプラグインは入れているが、何となく取れている数値は一部怪しい気がする。自分がアクセスするソースIPを対象から外していないせいかもしれないが。

と言うわけで、アクセスログ解析。今までのツールに合わせてLAMP構成で探してみたが、ちょっと求めているものとは違うものしか見つからない。結局、新しいものを探すのは諦めて、使った事のある解析ツールから選ぶ事に。HTML生成型として、以下の一般的に人気のあるツールがある。

  • analog
  • webalizer
  • awstats

今まで、analog → webalizer → awstats とツールを変えてきた。awstats以外は今となっては古いバージョンしか使っていないので最近のものについては知らないが、当時はリファラ周りの解析が不足していた。今回もまずはawstatsを使う事に。以前、使っていたときの不満としては以下。

  • URLEncodeしたURL内の日本語がデコードされない
  • リファラ上の検索キーワードが検索サイトによっては文字化けする
  • 日本語化がちょっと面倒

とりあえず、本家の最新版を落として構築してみる。落としたアーカイブを解凍して/usr/local辺りに配置。tools配下に存在するawstats_configure.plに設定されているパスを自分の環境に合わせて修正する。そして、このファイルを実行するとコンフィグを生成するか聞かれるので『y』と答える。次にサイト名を聞かれるので、それも正しく答える。最後にコンフィグを配置するディレクトリを聞かれるので、自分の環境に合わせて答える。すると、該当ディレクトリに『awstats.ドメイン名.conf』というコンフィグ・ファイルが出来上がる。うちの場合、apacheのアクセスログをデフォルト名から変えているので、それに合わせてコンフィグ・ファイルを修正する。あとは、以下のコマンドですぐにデータを生成できた。

${AWSTATS}/tools/awstats_updateall.pl now

データ生成後は以下のようなURLでawstatsのHTMLインターフェースにアクセスできる。

http://ドメイン名/awstas/awstats.pl?config=ドメイン名

軽い気持ちで作ってみたところ、HTMLの日本語化は普通に行われていた。リファラの検索文字列もきちんと日本語で表示されている。唯一、URLのURLEncodeは相変わらずエンコードされたままの表示。但し、firefoxの場合はURLをフォーカスするとステータスバーに日本語に変換されたURLとして表示される。HTML上でも同様に表示された方がわかりやすいが、わからないよりは遥かにまし。awstatsで求めていた機能が全て満たされてしまったので、今回もawstatsで解析をする事に決定した。

カテゴリ: 技術系  | タグ: , ,  | コメント