アタラのアトリビューションコンサルティング

「アトリビューション」を取り巻く誤解

アタラでは、アトリビューションについての総合情報サイト「Attribution.jp」を2010年に開設し、それと軌を一にしてアトリビューションコンサルティングを事業として始めた。少しずつ、アトリビューションが日本市場にも普及していることを感じているが、お問い合わせの内容はさまざまで、アトリビューションについての理解度は、かなりのバラツキがあるようだ。

「御社では、どのようなモデルで分析をしているのですか?」という比較的レベルの高い質問もあれば、「アトリビューションって何ですか?」や「アトリビューションって、どんなメリットがあるのでしょうか?」というような基本的な質問もあり、多岐にわたる。

ときには、「アトリビューションというツールについて教えてください」という質問もあり、誤解を招いているものもある。ちなみに、今後は分からないが、いまのところ、アタラではアトリビューションのツールを提供してはいない。


アトリビューションには障壁が多い

このような状況を踏まえ、正しい理解の一助となればとの思いもあり、アタラでおこなっているアトリビューションコンサルティングの一端を紹介することにした。アトリビューションは、その分析をおこない成果を上げるのには多くの障壁があるといわれていて、現場の実務で実践することが困難であるとの認識がある。

事実、実務でおこなうのは、とても大変だ。そのような中で、アタラとしては現状の課題を受け入れつつも、現時点で取得できるデータで対応できる範囲での分析とコンサルティングをおこなっている。そのすべてを紹介するのは難しいが、ここではコアとなる考え方を紹介してみたい。


アタラのアトリビューション

基本的に、アタラではアトリビューション分析とシミュレーションをコンサルティングサービスとして提供している。
アトリビューション分析とは、簡単にいうと、コンバージョンに至るまでの流入元の履歴のデータを使い、コンバージョンへの貢献度を各流入元に配分することである。


「アトリビューション・スコア」と「アトリビューションCPA」

アタラでは、各流入元に割り振った貢献度を数値で示すために「アトリビューション・スコア」という言葉を用いている。

また、この「アトリビューション・スコア」で、各流入元にかかった費用を割って得られる数値を「アトリビューションCPA」と呼んでいる。これは、これまでのラストクリックだけで算出したCPA(以下、「ラストクリックCPA」)と同様に、費用を成果で割って得られる数値である。

「アトリビューションCPA」では、成果つまりコンバージョンにあたるのが貢献度を示す「アトリビューション・スコア」になる。費用は、これまでのラストクリックCPAと同様に、その流入元に投下した費用となる。


「アトリビューション・ランク」

もうひとつ、アタラでは「アトリビューション・ランク」という用語も使っている。これは、各流入元を「アトリビューションCPA」によって比較するもので、最も効率がよかったものはどれか、2番目によかったものはどれか、という違いを表すために使っていると考えていただければよい。

ちなみに、「アトリビューション CPA」と同様に「アトリビューション ROAS」も算出できるが、CPAとROASは逆数の関係になっているだけなので、ここでは「アトリビューション CPA」で説明を進めていくことにする。

それでは実際に、「アトリビューション・スコア」、「アトリビューション CPA」、「アトリビューション・ランク」をどのように使うのか、簡単な例でみてみよう。


ラストクリック重視の落とし穴

たとえば、最初に、バナー広告Aをクリックして、広告主のサイトにアクセスしたユーザ(正しくはブラウザ)がいたとする。初回では、すぐにコンバージョンに至らず離脱するが、しばらくしてバナー広告Bをクリックして広告主のサイトに再訪問する。この2回目のアクセスでも、コンバージョンには至らず結局、離脱する。

しかし、2回の接触を通じて、ユーザの記憶に広告主のブランド名が残る。その結果、ブランド名で検索をして、リスティング広告経由で3回目のアクセスをした際、コンバージョンが1個発生したとする。

つまり、バナーA → バナーB → リスティング広告 → コンバージョン となったとき、投下している費用がそれぞれ、バナーA=100万円、バナーB=200万円、リスティング広告=300万円だったとしよう。

まず、ここで比較のために、これまでのラストクリックCPAを算出してみる。すると以下の表のようになる。

34-d1.jpg

発生したコンバージョン1個は、リスティング広告のみのお陰であると考えるのが、これまでのラストクリックでの分析の仕方である。そのため、貢献度を各流入元に割り振ると、表にあるように、バナーA=0、バナーB=0、リスティング広告=1となる。

したがって、ラストクリックCPAはリスティング広告のみでしか算出されず、表にあるように、バナーA=NA、バナーB=NA、リスティング広告=300万円(300万円÷1=300万円)となる。

通常、このような結果をみて、バナーAとバナーBは、リスティング広告に比べて獲得効率が悪い、コンバージョンにまったく貢献していないと判断されてしまうのが、これまでのやり方だった。


均等配分モデル

これに対して、「アトリビューション・スコア」「アトリビューション CPA」「アトリビューション・ランク」を使って表を作ってみる。

35-d2.jpg

ここでは、「アトリビューション・スコア」をそれぞれ3分の1としている。これは、いわゆる、均等配分モデルを使っているからで、流入元であるバナーA、バナーB、リスティング広告を、それぞれ均等に扱い、発生した1個のコンバージョンの貢献度を、それぞれ均等に割り振っている。この場合、流入元が3つあるため、3分の1ずつ割り振っている。

アトリビューションのモデルには、いろいろな考え方がある。詳細は、また別の機会に触れることにして、ここでは均等配分モデルで単純に配分したと理解して欲しい。

さて、このように均等に割り振った状態で、それぞれのCPA(「アトリビューションCPA」)を算出すると、表にあるとおり、バナーA=300万円(100万円÷1/3=300万円)、バナーB=600万円(200万円÷1/3=600万円)、リスティング広告=900万円(300万円÷1/3=900万円)となる。「アトリビューション・ランク」は、バナーA=1、バナーB=2、リスティング広告=3となっている。

表1と表2の違いをみて欲しい。表1では、リスティング広告が最も獲得効率がよいと判断されていた。一方、表2では、どうだろうか。説明するまでもないが、最も効率のよいのはバナーA、順に、バナーB、リスティング広告となっている。

表1と表2の大きな違いは、各流入元に貢献度を割り振っているか、いないかだけだ。それを、するかしないかで結果は大きく変わってしまうのである。

これまでの表1のやり方では「バナー広告は効果が悪い」と、出稿予算を減らされる、あるいは出稿停止になってしまっていた。しかし、この結果をみると、それが本当に適切なやり方なのかどうか、一考の余地があることが分かるだろう。

イチローと松井をアトリビューション分析

日本人メジャーリーガーを例にとってみよう。イチローはシングルヒットを大量に打つバッターで、松井は打点を稼ぐのが得意なバッターである。

これまでの表1のラストクリックCPAで評価するなら、イチローはチームに対してまったく貢献していないことになる。それはなぜか。打点を稼がないからだ。ラストクリックCPAでの評価は松井を過大評価し、イチローを過小評価しているようなものだ。

イチローは打点が少ないのに対して、松井は、得点圏にランナーがいるときにきっちりと打点を挙げてくれる。ラストクリックでコンバージョンを発生させるのが得意なリスティング広告のようなものである。

イチローを先発メンバーから外したらどうなるか

それでは、もし、ラストクリックでのコンバージョンが少ないイチローを評価せずに、先発メンバーから外したらどうなるだろうか。松井のような打点を稼ぐバッターばかりを1番から9番まで並べるのである。

その場合、チームとしての得点力は落ちるだろう。イチローのようなシングルヒットを確実に打つバッターもいないと、効果的に得点を挙げることはできないはずだ。また、そのように評価されているからこそ、イチローは起用され続けているはずだ。いや、年棒だけで判断するならば、松井よりもイチローの方が高く評価されているのが現実のはずだ。

チームにはイチローも松井も必要

つまり、バナー広告のように初回や中間クリックを発生させてくれる流入元、イチローのようなバッターも、メジャーリーグにおいては高い評価を得ていると考えていい。チームには、イチローのようなバッターも、松井のようなバッターも必要であり、それぞれのコンビネーションで得点力を高めていくはずだ。

先の流入経路(バナーA → バナーB → リスティング広告 → コンバージョン)の例も同様で、バナー広告とリスティング広告のコンビネーションで、コンバージョン力を高めていくことができる。そのためには、ラストクリックだけを評価する現在のフレームワークを捨てて、初回、中間、ラストのそれぞれを正当に評価するアトリビューション分析が必要だ。

事例で読み解くアトリビューション分析

ここまでは単純な例を使って、アタラで実施しているアトリビューション分析の基本的な考え方を紹介してきた。次に、具体的なクライアントのケースに沿ったアトリビューション分析と、その分析結果に基づいてシミュレーションをおこなった結果を紹介しよう。

ラストクリックCPAで媒体評価

このクライアントは、リスティング広告に月額2,000万円ほど、バナー広告に月額500万円ほど投下していた。合計で月額2,500万円だ。

これまでは、ラストクリックCPAで媒体の評価をおこなっており、バナー広告は、あまり効果が高くないようにみえるため、需要期以外では使わないという状況だった。このクライアントから依頼を受け、4月の広告出稿状況とコンバージョンに対してア、トリビューション分析を実施した。結果は次のとおりであった。

36-d3.jpg

表3のCVは「コンバージョン数」、A-スコアは「アトリビューション・スコア」、L-CPAは「ラストクリックCPA」、A-CPAは「アトリビューションCPA」とする。

ちなみに、リスティング広告は、10万個ほどのキーワードをGoogle AdWordsとYahoo!リスティング広告にそれぞれ出稿しており、バナー広告は純広告、アドネットワーク、リターゲティングなどを含み、それらの集計値、平均値を、この表には掲載していると考えて欲しい。ここで、バナー広告にアドネットワークやリターゲティングを入れているのは、あくまでも議論を簡略化するためである。

なぜ、バナー広告の評価が低い?

ラストクリックベースの評価では、リスティング広告が20,000個のコンバージョンをたたき出し、ラストクリックCPAは1,000円となっている。その一方で、バナー広告は1,000個のコンバージョンで、ラストクリックCPAは5,000円である。この状態では、バナー広告の評価が低いのも無理はない。

しかし、アトリビューション分析結果では、リスティング広告の「アトリビューション・スコア」は16,750スコアで、バナー広告の「アトリビューション・スコア」は4,250スコアとなる。そして、「アトリビューションCPA」をみると、リスティング広告が1,194円で、バナー広告が1,176円となっている。これは何を意味しているのだろうか。

バナー広告は、これまでのラストクリック評価ではコンバージョンが1,000個、「アトリビューション・スコア」は4,250スコア。単位はここでは関係ないので、1,000が4,250に増えたと理解していい。この差分である、3,250(4,250−1,000=3,250)は何なのか。

これは、初回や中間のクリックでコンバージョンを発生させていたものが、これだけあったということだ。いわゆる、間接効果の数だといっていい。

「アトリビューション・スコア」の合計に注目

ここで、次のことに注意して欲しい。気づいている方はいるかもしれないが、ラストクリック評価のときのリスティング広告のCV=20,000個とバナー広告のCV=1,000個を合計すると21,000個になり、リスティング広告の「アトリビューション・スコア」=16,750個とバナー広告の「アトリビューション・スコア」=4,250個を合計すると21,000個となって、この両方の数字は同じ値になる。

コンバージョン貢献度を異なるやり方で割り振ったあと、それぞれを合計しているので結局、最後のコンバージョン数としては同じになる。この合計値が異なっていれば、計算間違いをしているなど、なんらかの原因があるはずだ。

バナー広告の方が獲得効率はよい

つぎに、「アトリビューションCPA」でみると、リスティング広告=1,194円、バナー広告=1,176円になっている。ということは、間接効果も含めて考えると、わずかながらバナー広告の方が獲得効率はよいという結果が出たのである。

そうなると、これまでのリスティング広告重視の姿勢を変更して、バナー広告の出稿金額を増やした方が、コンバージョン数の増加する可能性も出てきたといってよい。

約10万個のキーワード、出稿最適化のシミュレーション

さらに、このアトリビューション分析結果に基づいて、出稿最適化のシミュレーションを実施してみる。このクライアントはリスティング広告に約10万個のキーワードを出稿していた。

キーワードの中には、コンバージョンに寄与しているものもあれば、寄与していないものもある。当然、コンバージョンに寄与しているキーワードの中には「アトリビューションCPA」が1,194円と、リスティング広告全体の平均値よりも高くなっているものが存在している。これらは、獲得効率があまりよくないキーワードになるため、ここで投下している費用をバナー広告に再配分することが考えられる。

同様に、実は、ラストクリックでのコンバージョンも発生していなければ、間接効果としてのコンバージョンも発生していない(いわゆるアシストもない)キーワードもある。これらのキーワードは、「アトリビューション・スコア」が0になり、間接効果も直接効果もないものになる。このようなキーワードも出稿停止にして、そこで使っている費用をバナー広告に配分する。

キーワードを整理して約800万円を捻出

「アトリビューションCPA」が1,194円より高いキーワード群と、間接効果も直接効果もないキーワード群の両方で、使っていたコストを割り出すと、このクライアントの場合、約800万円もの金額を捻出できた。

キーワードの中には、300円程度でコンバージョンしているものもあれば、5,000円以上かかっているようなものまであった。

それらすべての「アトリビューション・スコア」と「アトリビューションCPA」を算出し、「アトリビューション・ランク」の低いものから順番に、バナー広告への再配分対象としていく作業をおこなった。そして、「アトリビューションCPA」が1,194円以下で獲得できているキーワード、つまり効率のよいキーワードだけを残して、引き続きリスティング広告をおこなうことにする。

この800万円も「ちょっと多いかな」と最初は思ったが、他のクライアントでも同じような結果が出ているケースがあるので、もしかすると、よくあることなのかもしれない。

とくに、リスティング広告での出稿キーワード数が多い場合、リスティング広告全体の平均でみたCPAが見合っていればOKのケースが多い。そのため、個別キーワードでコンバージョン貢献度を厳密に測っていないケースがあり得る。今回のケースは、それにあたり、そのような例は他にもあると考えてよいだろう。

捻出した800万円をバナー広告にスライド

このようにして、捻出した800万円をバナー広告にスライドしたとして、シミュレーションを実施してみる。全体の出稿金額は、引き続き月額2,500万円で変更はない。

まず、バナー広告経由でのコンバージョン数は、どうなるだろうか。1コンバージョンが「アトリビューションCPA」=1,176円で獲得できるとすると、800万円をバナー広告に追加で投下することによって、6,800個のコンバージョンが追加で獲得できることになる。

ただ、ここで、リスティング広告によるマイナスの影響も考慮しないとならない。リスティング広告では、出稿金額を800万円減らすことになる。この800万円は、さきほど説明したとおり「アトリビューションCPA」が1,194円より高いキーワード群と、間接効果も直接効果もないキーワード群の両方から捻出したものなので、これらのキーワードで獲得していたコンバージョンは減ることになる。その数を計算すると、約2,000個のコンバージョンがあった。

出稿金額は変更なしで、4,800個のコンバージョンが増加

つまり、800万円をバナー広告にスライドさせることによって、プラスで6,800個、マイナスで2,000個となり、プラスマイナスでトータルは4,800個のコンバージョンが増加するという結果になった。出稿金額は月額2,500万円のまま変更なしで、4,800個のコンバージョンが増加するという結果だ。

表3にあるとおり、4月の実際のコンバージョン数は21,000個だ。プラスで4,800個も増加するというのは、とても大きいといえるだろう。


シミュレーションに振り回されない

この最適化シミュレーションは、あくまでもシミュレーションであって、出てきた数値も参考値程度に解釈すべきものである。そもそも、シミュレーションとは、そういうものであり、コンバージョン数を予測して正確にあてようとするものではない。

とくに、今回のシミュレーションでは、4月に発生した流入経路のすべてが5月にも、まったく同じだったと仮定して算出していることになる。当然のこととして、初回、中間、ラストに至る流入経路が、4月と5月でまったく同じであることはあり得ない。初回、中間、ラストのコンビネーションは変わるはずである。

また、アトリビューションモデルも均等配分でおこなっているが、実際には他のモデルを当てはめた方がよいという可能性も否定できない。そのため、あくまでも単純なシミュレーションであると理解して欲しい。

ただし、確かに単純なシミュレーションではあるが、まったく意味がないかといえば、そんなことはない。単純なモデルと単純なシミュレーション方法で導いた結果とはいえ、これまで貢献度を評価していなかったラストクリック以外の各流入元も考慮した上で、シミュレーションをおこなっている。少なくとも、ラストクリックだけに偏っていた、これまでの手法よりは現実に近い形で、評価ができている可能性がある。

クライアントを、どう説得するか

どの程度、このシミュレーション結果が確かかを調べるためには、シミュレーションにしたがって、実際に800万円分をバナー広告にスライドしてみればいい。ただ、クライアントには「確からしさを調べたい」というような冒険心はないのが普通だ。当たり前である。実際のお金を使ってマーケティングをおこなっているからだ。

今回の分析では、バナー広告の獲得効率が良い可能性があり、シミュレーションの結果に従えば4,800個もコンバージョンが増えると主張しても、クライアントは「はい、分かりました」とはならない。クライアントは、もちろん半信半疑だった。いろいろと議論した末に、実験的に200万円分だけバナー広告へスライドさせることに落ち着いた。

スライドさせた結果、プラスマイナスで500個ほどのコンバージョンがプラスになった。実は、200万円分で同様のシミュレーション計算をすると、800個ほどのプラスになるという結果が得られていた。それと比較すると、やや下振れしたことになる。

シミュレーションの結果どおりにはならなかったが、月額2,500万円で、コンバージョン数は21,000個から21,500個に増えたことになる。200万円をリスティング広告からバナー広告にスライドさせたことによって、獲得効率はよくなったといってもいい。

コンバージョンが増えた要因は複数ある

もちろん、断定はできない。コンバージョンが増えた理由は、季節的な要因などもあり得るし、バナー広告のフリークエンシーなどが変化したことや、初回、中間、ラストのコンビネーションが大きく変化したことなども影響を与えるかもしれない。

200万円をスライドさせたこと以外にも、いろいろと検討する余地があるのは確かである。コンバージョンへの影響は、さまざまな要因が考えられるため、単純化して考えることにリスクが伴うのは承知している。しかし、現場で実際に最適化のオペレーションをおこなっていくためには、ある程度の単純化はやむを得ないと考えている。

さまざまな要因があり得るとはいえ、それらを厳密に分析することが非現実的である以上、分析できるデータと使用可能なモデルを使ってソリューションを導き出し、少しでも前に進んで行く方が懸命であろう。

すくなくとも、これまでのラストクリックでの評価よりは、良い分析ができるはずだ。ラストクリックでの評価は、ここで紹介しているものよりも、はるかに単純な手法であるのはいうまでもない。


均等配分モデルの影響

さて、コンバージョンが増加した要因は、さまざまなことが考えられるが、仮にそれらが変化しなかったとしよう。200万円をスライドさせたこと以外は、変化をしなかったと仮定すると、このシミュレーションでは800個増加のコンバージョンと実際の500個増加のコンバージョンの差異=300個は、何から発生しているのだろうか。

これは、アトリビューションモデルとして、均等配分を採用していることから発生していると考えられる。つまり、リスティング広告もバナー広告も、すべて均等に配分して「アトリビューション・スコア」「アトリビューションCPA」を算出していたのだが、他の条件が一定と考えると、このシミュレーションの結果が下振れしたということは、その分だけ、バナー広告への評価を高めに配分していたからだと考えられる。

つまり、本当は、もっと低めに配分した方がよかったといえる。したがって、次のアトリビューション分析では、リスティング広告とバナー広告への配分を均等ではなく、バナー広告への配分を少し割り引くことで、このクライアントへのアトリビューション分析とシミュレーションの精度を向上することが可能であろう。

ところで、他のクライアントでは、シミュレーションよりも上振れすることもあった。その場合は、バナー広告への配分を少し割り増して、再度アトリビューション分析をおこない、シミュレーションすることになる。

プログレッシブ・オプティマイゼーション・アプローチ(Progressive Optimization Approach)

このように、上振れ/下振れに応じてアトリビューションモデルの修正プロセスを繰り返しおこなっていくことで、全体の精度が向上していく。この繰り返しの手法を、アタラでは「プログレッシブ・オプティマイゼーション・アプローチ(Progressive Optimization Approach)」と呼んでいる。

アタラ・メソッド(ATARA Method)

また、「アトリビューション・スコア」「アトリビューションCPA」「アトリビューション・ランク」を使ってアトリビューション分析を実施し、最適化シミュレーション、そして、プログレッシブ・オプティマイゼーション・アプローチを取る一連の方法を、「アタラ・メソッド(ATARA Method)」と名付けて紹介している。

先述した、イチローと松井の例でいえば、この「アタラ・メソッド」によってイチローの貢献度を、これまでのラストクリックベースの評価に比較して、より正当に評価できる。その結果、全体の得点力=コンバージョン力の向上につながるのである。

ラストクリック評価から脱却

今回のアタラ・メソッドの紹介では、議論を簡略化するために、リスティング広告とバナー広告という2つに流入元を分けて考え、最適化シミュレーションの例をだした。

実際の現場の実務においては、さまざまな純広告、タイアップ広告、動画広告、アドネットワーク、アフィリエイト、ソーシャルネットワーク、リスティング広告、自然検索など、多数の流入元別に分析することになる。そのため、リスティング広告からバナー広告への出稿予算のスライドという、単純なシナリオになるとは限らない。

また、リスティング広告への出稿金額に対して、バナー広告への出稿金額が少なすぎた場合、シミュレーションがうまくできないケースも実際にあった。というのは、初回や中間でコンバージョンに影響を与えているクリック数が、あまりにも少なかったために、バナー広告の「アトリビューションCPA」が非常に高い数字になってしまったのである。

このように、実務においては、今回紹介したケースよりも複雑であるし、場合によっては、うまくシミュレーションできないケースもあるのは確かだ。しかしながら、多くの場合はサイトカタリストなどの効果測定ツールで、コンンバージョン・パスのデータ、つまり、流入経路と流入元のデータが計測できているならば、ここで紹介した方法を使ってコンバージョンの効率を向上できる可能性が高い。

ラストクリックだけを評価していた評価方法から脱却し、初回、中間の各流入元まで含めて評価する方法を使って、コンバージョン数を増加できる可能性は大きい。もし、データが計測できているのであれば、ぜひ、アトリビューション分析をご自分でも試していただきたい。それによっては得られるメリットは大きいと信じている。

アタラ合同会社
COO
有園 雄一(Yuichi Arizono)
Google+

37-atori_pleasure.jpg
【アトリくんの視点】
アタラのメソッドをここまで解説したのは初めてです。参考にしていただけましたでしょうか?今回を皮切りに、有園さんのコラムの連載を開始します!

コメント