アナリティクスで「参照元 (direct) / (none)」として振り分けられたリファラスパムを除外する方法

Googleアナリティクスの結果に関して 最近(2014年5月くらい)いわゆる「リファラスパム」が激増しています。

これに関しては先日投稿した「GoogleAnalyticsのデータにリファラスパムが入るのを防ぐ方法」の記事でも触れたように、フィルタリングで対応しているものの、イタチゴッコの状態・・・

で、それとは別に、最近かなりストレスになっているのが「参照元/メディア」における「(direct) / (none)」の増加です。

一般的に「(direct) / (none)」は「お気に入り・ブックマークなどから直接流入した場合」と解釈されるようですが、最近、このデータの中にリファラスパム的な特徴を持ったものが多く紛れ込むようになりました。

詳細に関しては後述しますが、これらの疑惑系「(direct) / (none)」は以下のような特徴をもっています。

・アクセスが一定時間に集中する

・ほとんどが海外からのアクセス

・言語設定やホスト名が(not set)

要するに、リファラスパムとほぼ同様の特徴を持っているわけです。

推測するに、これらは本来リファラスパムスパムとしてアクセスしてきたものの、なんらかの理由で「参照元なし」に振り分けられてしまった「リファラスパムの落ちこぼれ群」ということなのでしょう。

これがリファラスパムであれば、参照元リンクのデータから「除外フィルタ」を作成することもできるのですが、(direct) / (none)の場合は、そうもいきません。

とはいえ、アクセス数の少ないサイトにおいてはこの「落ちこぼれリファラスパム」の数値が、とんでもなく邪魔なのも事実なので、今回は、これに対処する方法をアレコレ探ってみました。

※以下の記事はわたし自身が「検証中」の段階で公開しています。施策の効果については未知数ですので、あくまで参考としてお読みください。

落ちこぼれリファラスパムの確認

以下は私が運営している、とあるサイトのデータです。

direct_001

サイト全体でページ数が3つほど。しかも(自分でいうのもなんですが)特に有益な情報もない弱小ブログなのですが、5月28~29日の全22セッションのうち、実に16件が「(direct) / (none)」となっています。

この間、私自身はこのサイトを閲覧していませんし、上述のように弱小なこのブログをわざわざブックマークしている人がいるとも思えません。

「(direct) / (none)」の場合、リンク元の表示などはできないので、セカンダリディメンションで「地域」を指定して表示させたのが以下の結果。

direct_002

これは要するに「(direct) / (none)」で訪れた人の住む地域を表しているわけですが、東京が一件あるほかは、クイーンズランド、イングランドなど海外からのアクセスばかり。

どう考えても、わたしのコテコテ日本語ブログを読みに来ているまともな読者の方ではなさそうです。
さらに、セッション全体を時間別で表示させた結果が以下。

direct_003

29日の朝9時の1時間だけで「19件」のアクセス。特定の時間帯に、異常にアクセスが集中しており、これはリファラスパムなどでお馴染みの形ですね。

以上のことから推測するに、本来はリファラスパムとして訪れたアクセスが、なんらかの理由で「参照元あり」とは認識されずに、(direct) / (none)として振り分けられてしまっているということが考えられます。

さらに「ユーザー>地域>言語」で表示させた結果が以下。

direct_004

(not set)が19件。
この19という数字、前述の「参照元/メディア」表示における「(direct) / (none)」と、「www4.free-social-buttons.com / referral」の合計数と一致しています。

で、この(not set)にセカンダリディメンションで「地域」を指定してやると・・・

direct_005

先の「(direct) / (none)」の地域とドンピシャ。
つまり、参照元が「(direct) / (none)」で、かつ言語設定が「(not set)」の場合は高確率で「リファラスパム」と考えてもよいようです。

落ちこぼれリファラスパムを除外する

さて、冒頭に立ち返って、この(direct) / (none)に振り分けられてしまった「落ちこぼれリファラスパム」の除外方法を考えてみましょう。

いくつか方法はあるかも知れませんが、わたくしの場合、「言語設定が(not set)のものは除外する」フィルタを作成して対処しています。

もちろんこの方法だと、「言語設定が(not set)だが、まともなアクセス」も除外されてしまうので、けっこう荒っぽく強引な手段ということになります。

「アナリティクス設定 > ビュー」で「フィルタ」をクリック。

ru_003

「新しいフィルタ」をクリック。

direct_007

「ビューにフィルタを追加」画面で以下のように設定します。

filter_gengo_001
・フィルタ名:言語(not set)を除外 *任意の名前で可
・フィルタの種類:除外
・フィルタフィールド:言語設定
・フィルタパターン:\(not set\)*バックスラッシュは半角

「保存」を押して終了です。