ラウンドナップ・コンサルティング公式ブログ 代表中山陽平が記事執筆。コンサルのノウハウ進化のための情報収集の一部を発信中。2004年〜開始。

Google検索経由のRefererから新たな情報が?(ved変数の値)

20130529_inbound-marketing-anatomyGoogle検索のSSL化によって、Googleのどんなキーワードから流入してきたアクセスなのかということは、基本的にはわからなくなってしまいました。

Referer自体は取れるのですが、そのRefererから明確にわかるのは今のところ検索結果(SERPs)での表示順位くらいです。

昔は検索クエリ(キーワード)を取得出来ました。しかし、リダイレクトを挟む仕様になったこと、そしてSSL化したことで、取得できなくなってしまいました。

取得できるのは、意味不明なパラメータのついたRefererだけなのが現状です。

解析はずっと試みられているが、大きな成果はない

そこで、このRefererに入っているパラメータから何か読み取れないかという試みは以前から行われています。謎の文字列からクエリ情報が取り出せるのではないか?など…。

しかし、きっちり暗号化?されているせいか、せいぜいcdという変数に検索順位が入っているということくらいしか、今のところ分かっていません。(このcdという変数を取得することで、GoogleAnalyticsでGoogleでの検索順位を取得してカスタム変数に入れる、みたいなことができます。

 

しかし今回、それに加えて一部のパラメータの意味が分かったかもしれません

もちろんGoogle公式の情報ではないですし、みっちりと検証されているわけではありません。その前提でご紹介します。

記事はこちら。

▼Decoding Google’s Referral String (or, how I surviVED Secure Search) | SEOmoz

前提としてのHTTPリクエスト上の動き

http_google前提として、Googleの検索結果からの動きやHTTPリクエストについて少しまとめます。

今、検索結果から実際のページに遷移する間に挟まっているページ、言い換えるとアクセス解析ツールにRefererとして入ってくるURLは例えば以下のようなものです。

以下の様な流れです。Googleの計測のためかと思います。

[Googleの検索結果(SSL)]→[Google内部でのリダイレクトURL(非SSL)]→[リンク先ページ]

変数のくくりごと改行していますが実際は一行です。

http://www.google.co.jp/url?
sa=t&
rct=j&
q=&
esrc=s&
source=web&
cd=1&
cad=rja&
ved=0CC8QFjAA&
url=http%3A%2F%2Fwww.roundup-consulting.jp%2F&
ei=PH-kUYe0IIjukAWQ9YCoCA&
usg=AFQjCNFo0VoZ7CKyyagFBowLiflWZDp3yQ&
sig2=BolpUH5XStay7Ue6LjjQyw

ちなみに、元々の検索結果のURLはこんなもので

https://www.google.co.jp/search?
q=roundup-consulting&
aq=f&
oq=roundup&
sourceid=chrome&
ie=UTF-8

ここのqという変数の値を取得できたので、昔は流入検索キーワードが分かりました。

ですが今は、その間に先ほどの意味不明なリダイレクトURLを挟んできます、また、SSL→非SSLページなのでブラウザは基本的にはRefererを残さないということもあります。合わせ技です。

故に(not provided)となり、ウェブマスターツールの、ざっくりとしたデータのみに頼ることになっているのが現状です。

パラメータについて分かっていることは殆どない

1年前の記事ですが、いくつかのパラメータについて、恐らくこうではないかということをまとめている記事はいくつかありまいた。例えばこちらです。「Deconstructing Google url search parameters

この中では

  • saはユーザの検索行動に関係しているのではないか(別ソースで、sa=Nは検索結果をクリックした場合、sa=Xは関連検索をクリックした場合などとありますが、sa=tについての情報はなく、また情報の正確性も不明)
  • esrc=sは、SSL検索経由だと付与される模様
  • source=webはWEB検索だという意味ではない。画像検索だとsource=imageなどになるわけではない。ツールバー経由などか?(でも、FireFoxのツールバー経由でもsource=webでした)

なんていうことがありますが、結局あまり良くわかっていない状況です。

今回注目されたのは「ved」

この謎の文字列であるved、例えば先程の例だと「0CC8QFjAA」のところです。ここに規則性を見つけたとのことです。それがその下の図です。

1369110059 6b682464a7184a648d7f13748f693a26

SearchVerticalの部分が、検索結果でクリックされたエリアでは?

1.QFj = 通常検索

まず「QFj」と入っているものは通常検索結果経由のクリックという意味ではないか?とされています。実際先ほど私がサンプルとして出したものもそうなっています。

2.QqQIw = ニュース欄のテキスト部分では?

以下の部分からクリックされると、QqQIwというパラメータが入るのでは?とされています。(Iは大文字のiでLの小文字ではない)

画像は元記事から転載しています。

NewImage

例えば「自民党」で検索して出てきたニュースのリンクURLは以下です(一部省略していますが)確かにQqQIwが入っています。

https://www.google.co.jp/url?….&cad=rja&ved=0CFYQqQIwBw&url=h…rklB-g

QpwI = ニュースの画像部分では?

以下の部分です。これも適当なクエリで試してみましたが、いくつか試した範囲では確かに入っていました。

NewImage

まとめると

調査結果をまとめると以下のようになるようです。

  1. 通常検索:QFj
  2. ニュースのテキスト部分:QqQIw
  3. ニュースのイメージ部分:QpwI
  4. 画像検索結果の画像:Q9QEw
  5. 動画のテキスト部分:Qtwlw
  6. 動画のイメージ部分:QuAIw
  7. サイトリンク:QjB
  8. ナレッジグラフのリード画像部分:BEPwd
  9. ナレッジグラフのノンリード画像部分:BEP4d
  10. イベント:xxxBE0MGM

どのように使うかというのは、なかなか難しいところですが、多用なコンテンツ形態をとって配信している場合には有効かもしれません。
サイトリンクなどは便利そうですね。

サイトリンク関係の補足

ちなみにサイトリンクの場合の補足ですが、いくつか追加で見てみたのが以下です(これは元記事には記載されていない情報で、私が3〜4サイト見ただけでそれ以上検証していないです)

  • いわゆるサイトリンクではなく、検索結果の下に小さく出るminiサイトリンクの場合は恐らく「Q0gI」
  • パンくず部分からだと「Q6QU」

GoogleAnalyticsにカスタム変数として取り込むには

これは、Googleの順位を取り込むのと基本的には同じです。フィルタを使います。

具体的には、フィルタの種類を「カスタムフィルタ」にして、アドバンス設定にし

フィールドA → 引用Aを 参照元にして  (?|&)(ved)=([^&]*)
フィールドB → 引用Bを 参照元にして (?|&)(cd)=([^&]*)
出力先は カスタム変数 で $A3 – $B3

英語版ですが、以下の画像もご覧下さい。

NewImage

そして、参照sourceに出力したければ、もう一つフィルターを足します。
あそこの値をいじりたくない方はこちらは行わないほうがいいかと思います。カスタム変数に先ほど入れた値を付記する形なので。

NewImage

これを行うと、以下のように参照元ソースが先ほどの分類ごとに分かれるようになります。

NewImage

後はこれをもとにアドバンストセグメントを使って分類してみてみる…というやり方です。

使い道は限定されるが…

正直私の場合は、通常検索の画像部分や動画部分やニュースなどからの流入はほぼゼロ(動画は多少あるかもですが)なので、あまり意味が無いかなと思っています。

しかし、メディア系のサイトでは使い道は大きいかもしれません。特にGoogleにニュースサイト扱いされているサイトなど。

サイトリンクは面白そうですね。

これをきっかけに、もっといろいろなパラメータの意味がわかってくればいいなと思う次第です(でもGoogleが仕様を変えたら…と思うとイタチごっこなので追いすぎるのも切なさそうですね)

Webコンサルタント中山陽平公式サイトお悩みの方へ。一回のご相談で解決することもあります
ラウンドナップ・コンサルティングへのお問合せ方法 お電話でのご相談もお気軽に。[048-234-3361](10〜16 土日祝日除)全国対応 24時間受付 お問合せメールフォーム