4
9 実践 分析の教科書 Chapter 1 インタビュー ケネス クキエ 英エコノミスト誌 データエディター 実践 分析の教科書 8 Intertiew インタビュー Introduction データ分析とは View 目的別分析手法 CaseStudy ケーススタディ Keyword キーワード How to Analysis 私の分析法 北川 拓也 楽天 執行役員 ビヘイビアインサイトストラテジー室 室長

スコアリング - Nikkei BPec.nikkeibp.co.jp/item/contents/brouse/t_235470.pdf · to1マーケティンググながらないことを痛感した」と、1を十分に踏まえないと、成功にはつ社内と連携を深めて実際のビジネスルに向き合うだけでなく、積極的にったこともある。

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: スコアリング - Nikkei BPec.nikkeibp.co.jp/item/contents/brouse/t_235470.pdf · to1マーケティンググながらないことを痛感した」と、1を十分に踏まえないと、成功にはつ社内と連携を深めて実際のビジネスルに向き合うだけでなく、積極的にったこともある。

9 実践! “超”分析の教科書

Chapter 1 インタビュー

 

ベストセラーとなった書籍『ビッグデー

タの正体』の共著者で、英エコノミスト誌

のデータエディターであるケネス・クキエ

氏││。

 米ハーバード大で物理学とデータ分析

を学び、帰国後は楽天執行役員に就任し、

データを利活用した新しい展開を模索する

北川拓也氏││。

 

ビッグデータについて深い見識を持つ

2人に、これから社会や経済、人々の生活

がどう変わっていくのか、忌憚なく議論し

てもらった。

これからの社会や人間を

ビッグデータはどう変えるのか

北川氏 まず自己紹介させてくださ

ケネス・クキエ氏[英エコノミスト誌 データエディター]

い。私は米ハーバード大学と大学院

で9年間、物理学とデータ分析を学

び、帰国後に楽天に入社して主にデ

ータサイエンスに従事しています。

 

例えば楽天はKoboブランドで

電子書籍サービスをグローバルに展

開していますが、日本のコンテンツ

で世界ではまだ知られていないもの

実践! “超”分析の教科書 8

Intertiew ̶インタビュー

Introduction ̶データ分析とは

View ̶目的別分析手法

CaseStudy ̶ケーススタディ

Keyword ̶キーワード

How to Analysis ̶私の分析法

ビッグデータ時代の到来が叫ばれる昨今、多くの企業はデータの利活用に躍起になり始めている。

こうしたデータの蓄積・分析の普及は、社会や人々の生活にも大きな変革をもたらしそうだ。

データは私たちにどんな影響をもたらすのか。日米の気鋭のサイエンティストが語り合った。

北川 拓也氏[楽天 執行役員 ビヘイビアインサイトストラテジー室 室長]

産業革命と同規模のインパクト

ビッグデータで社会は変わる

Page 2: スコアリング - Nikkei BPec.nikkeibp.co.jp/item/contents/brouse/t_235470.pdf · to1マーケティンググながらないことを痛感した」と、1を十分に踏まえないと、成功にはつ社内と連携を深めて実際のビジネスルに向き合うだけでなく、積極的にったこともある。

77 実践! “超”分析の教科書

Chapter 4 ケーススタディ

いるのは、Web販売部1to1マ

ーケティンググループ。営業実務の

経験者でデータ解析にも長けている

渋谷直正アシスタントマネジャーを

分析リーダーとした、10人弱の組織

だ。データ分析と顧客サービスの兼

任体制であるため、データ分析だけ

でなく、マーケティング施策の実行、

そして検証もできる組織になってい

る。

 

同グループはまず、個別の顧客を

分析するためにWebサイトのアク

セスログデータの収集・分析の仕組

みを構築。その後、2012年7月

に日本IBMのツール「SPSS

odeler」を導入して、本格的な

ビッグデータ分析・活用を開始した。

 

訪問者の行動データを回帰分析し

てモデル化をしている中で、徐々に

注目に値する成果が出始め、担当者

は手応えを感じている。例えば、「A

という行動を取る顧客群(セグメン

ト)には、Aのコンテンツが求めら

れている」といった仮説を設定。詳

細な分析をしたうえで、顧客が望む

商品やサービスを提供する。

 

大きな成果を上げたのが、

2013年秋に実施した「女子旅@

海外」というコンセプトの海外ツア

ー商品の販促だ。過去に女子旅@海

外を購入した数千人から1万人程度

の顧客が自社サイトのどのWebペ

ージを閲覧したか、といった行動傾

向を分析。同じような行動傾向があ

るものの、これまで海外ツアー商品

を購入したことがない訪問者に対し

て、自社サイト内のバナーで女子旅

@海外を薦めたところ、通常に比べ

て10倍というコンバージョン(購買)

率を達成した。

過去には手痛い失敗も

 

もちろん、すべてうまくいくもの

ではない。分析結果に基づいて特定

の路線をレコメンドしたところ、そ

の時期が同路線の繁忙期で満席状態

だったため、販促効果が得られなか

ったこともある。「データ分析ツー

ルに向き合うだけでなく、積極的に

社内と連携を深めて実際のビジネス

を十分に踏まえないと、成功にはつ

ながらないことを痛感した」と、1

to1マーケティンググループの野

口雄一郎グループ長は語り、そのこ

とを良い教訓としているという。

 

今後、Webサイトで実践してき

たデータ分析、接客をリアルな顧客

接点にも展開していく。

「女子旅」と相関が高い層へ訴求して成果海外旅行商品を購入した顧客に関する情報から「女子旅」との相関が高い要因に基いた判別モデルを構築し、ロジスティック回帰分析を実施。分析結果として得られたセグメントに対して、該当する商品をサイト内バナーで推奨した。バナーもターゲットに合わせてデザインしている

通常の10倍の購買率

実践! “超”分析の教科書 76

Intertiew ̶インタビュー

Introduction ̶データ分析とは

View ̶目的別分析手法

Keyword ̶キーワード

How to Analysis ̶私の分析法

CaseStudy ̶ケーススタディ

09❸将来を“予測する”

個別の顧客の動向を分析するため、まずWebサイトのアクセスログデータを収集・分析。

仮説を立て、データを詳細に分析することで、顧客の望むサービスを開発してきた。

なかでも海外ツアー商品「女子旅@海外」は、サイト訪問者の購買率が従来商品の10倍に達するヒットになった。

サイト訪問者の行動を分析し

海外ツアーの購買率を10倍に

ビッグデータ → ■■■■ 117p

日本航空

 

日本航空は膨大なデータを活用し

た効果的なマーケティングを推進し

ている。1日約40万人に及ぶ自社サ

イト訪問者の行動傾向を分析。分析

結果を基にターゲット層を限定して、

海外旅行商品の販促をしたところ、

通常の10倍の購買率を達成した。

 

日本航空のWebサイトは24時間

365日、顧客との接点になる重要

な旗艦店舗である。国内線航空券の

年間販売額約5000億円のうち、

自社Webサイトでの販売比率は実

に50%を超える。サイトの閲覧、検

索、購買など日々大量のデータが蓄

積されており、活用しない手はない。

 

ビッグデータを活用したマーケテ

ィング施策の企画・展開に当たって

適切な数のスタッフと部品を揃え、日本航空の航空機のメンテナンスを担う整備場

Page 3: スコアリング - Nikkei BPec.nikkeibp.co.jp/item/contents/brouse/t_235470.pdf · to1マーケティンググながらないことを痛感した」と、1を十分に踏まえないと、成功にはつ社内と連携を深めて実際のビジネスルに向き合うだけでなく、積極的にったこともある。

79 実践! “超”分析の教科書

Chapter 4 ケーススタディ

表現します。この時、計算を簡便に

するために、ロジットと呼ばれる指

標を使うことが慣習になっています。

ロジットは、オッズと呼ばれる指標

の対数をとったものです。ロジット

やオッズと確率は、一対一に計算で

きるため、ロジスティック回帰によ

ってロジットが計算されると、オッ

ズを経由して確率を計算できます。

ロジットが増えれば確率は増え、ロ

ジットが減れば確率も減ります。

 

一方、決定木はyとxの関係を分

岐木の形で表します。決定木の便利

なところは、yと関連の強いものほ

ど木の上の方に出てきて、関連が弱

いものは木に現れないことです。そ

のため、自動的に有益な特徴xだけ

が木の中に現れます。決定木はロジ

スティック回帰のように確率を計算

することもできますし、商品の購買

回数といった数値を計算することも

できます。

 

図表2の場合、一番上が全集団を

表し、枝に書かれている条件で集団

が分岐していきます。一番下のノー

ドにその集団のyの分布が書かれて

います。この結果では一番左の男性

グループは購買数が平均1・06で比

較的多いものの、女性かつ年齢30歳

以上で総務部という集団の購買数が

1・44と最も多いことが分かります。

 

ランダムフォレストは、ランダム

サンプリングと決定木を組み合わせ

た手法です。データをランダムサン

プリングし、決定木を作るという操

作を何千回と行って擬似的にデータ

を増やし、精度を上げる手法です。

ランダムに何千回と作った決定木を

組み合わせてyを予測するので、森

(フォレスト)と表現されています。

 

この方法で作ったモデルは、決定

木よりも精度が高くなることが知ら

れています。さらにランダムフォレ

ストでは、決定木を応用して、yと

関連の強いxを順番にランキングし

ますので、重要度の高いxを調べる

ことができます。重回帰の時に気に

した多重共線性も気にしなくてよい

ため、どんな時にも活用できる万能

な手法と言われています。

 

このように、様々な手法によって

モデルを作ることができ、反応率を

予測できます。このように予測され

た反応率を手がかりにして、DMを

発送する顧客を選別したり、メール

を送るユーザーを選んだりすること

で、コストを下げたり効率を上げた

りすることができます。

①xをランダムにm個サンプリング

①データをランダムに n個サンプリング

②学習データを作る

③決定木を作る

①~③をB回(数百~数千回)繰り返し、B個の決定木を作る

y x1123456

x2 x3 …

⇒B個の決定木の多数決で予測を行う

インターネットバンキング<0.5

0.1555n2199

0.2563n=398

0.1699n=918

0.2403n=3658

0.2945n=1820

月最低残高>=2.5 月最低残高>=2.0

月最低残高>=7.5

図表3 ランダムフォレストの仕組み

30Node 2(n=1081)

25

20

15

10 1.065

0

男性

factor(Sex2)p<0.001

{女性、未入力}

1

図表2 分析ツールOrionを使って、ある商品の購買数に対して決定木を行った例

実践! “超”分析の教科書 78

Intertiew ̶インタビュー

Introduction ̶データ分析とは

View ̶目的別分析手法

Keyword ̶キーワード

How to Analysis ̶私の分析法

CaseStudy ̶ケーススタディ

❸将来を“予測する”

ロジスティック回帰 → ■■■■ 121p

 

データを分析することで、ある程

度将来を予測できることが分かって

います。ビジネスで多く活用されて

いる将来予測は、主にユーザーの反

応の予測です。DM(ダイレクトメ

ール)を発送した時の返送率、メー

ルを配信した時の開封率などが代表

的なものです。日本航空はユーザー

の反応率を予測することで、反応率

の高いユーザーに絞って販促を実施

しました。その結果、購買率が通常

の10倍になりました。

 

このような分析をするためには、

〝データマート〞という、分析のため

の専用データを作成する必要があり

ます。データマートは、ユーザーを

表す行と、ユーザーの特徴を表す列

から成る行列の形をしています。デ

ータマートのうち、予測したいもの

をyと表現して、予測するために利

用する特徴をxで表します。

 

このyを、xを使って予測するた

め、様々な分析手法が利用されます。

多くの場面で利用されるのは「ロジ

スティック回帰」と「決定木(けって

いぎ)」という手法です。また、より

精度の高いランダムフォレストとい

う手法も利用が増えてきました。ど

の手法も「xを使ってyを予測する」

という根本的な役割は変わりません。

ユーザーの属性データや行動履歴デ

ータなど複数のxを使って、様々な

手法で、例えばDMの返送率yを予

測します。このようにyをxで表現

するものを「モデル」と呼びます。

アルゴリズムということもあります。

 

ロジスティック回帰は、重回帰の

一種で、ユーザーが反応する確率を、

いくつかのxを足し合わせた数式で

ロジスティック

回帰、決定木

様々な手法でユーザーの反応を予測

反応スコアリング

図表1 yをxで表現する「モデル」

30Node 4(n=1845)

25

20

15

10 0.715

0

30Node 6(n=25)

総務部 それ以外

25

20

15

10 1.445

0

30Node 7(n=282)

25

20

15

10 0.325

0

30<

Agep<0.001

factor(Busho2)p<0.001

>30

3

5

y = f(x1, x2, x3, …)

予測したい反応率(結果変数)

yを説明するための特徴(説明変数)

yをxで説明するモデル(ロジスティック回帰、決定木、ランダムフォレスト、…)

Page 4: スコアリング - Nikkei BPec.nikkeibp.co.jp/item/contents/brouse/t_235470.pdf · to1マーケティンググながらないことを痛感した」と、1を十分に踏まえないと、成功にはつ社内と連携を深めて実際のビジネスルに向き合うだけでなく、積極的にったこともある。

実践! “超”分析の教科書 140

Intertiew ̶インタビュー

Introduction ̶データ分析とは

View ̶目的別分析手法

CaseStudy ̶ケーススタディ

Keyword ̶キーワード

How to Analysis ̶私の分析法

03How to Analysis

米澤 香子 氏 Kyoko Yonezawa 電通 コミュニケーション・デザイン・センター クリエーティブ・テクノロジスト東京大学大学院学際情報学府を経て電通に入社

東京大学大学院でデータ分析を学んだにもかかわらず、電通でクリエーティブの仕事を選んだ。

自分と同じ理系の技術者がものづくりに賭ける〝想い〞を表現したかったという。

そんな米澤氏の仕事のカギは、当たり前のようだが徹底した議論と信頼の構築にある。

仕事にはディスカッションと

信頼関係の構築が重要