お問い合わせ
2020.10.08

スマホゲームのインストール直後の行動データから、将来課金サービスを利用するかどうかを予測した
予測モデルはロジスティック回帰、XGBoost、DNN(ディープラーニング)の3つを用いて精度を比較した
DNN(ディープラーニング)を用いた場合、ランダム抽出に比べて最大9.03倍の適合率で課金ユーザーを予測できた
この課金ユーザー予測のアルゴリズムを用いることで、LTVを加味した広告運用のPDCAの高速化や、課金サービスを利用する可能性が高いユーザーに限定したクーポン発行が可能になる
ゲームアプリが大半を占めるオンラインプラットフォーム市場は、2019年度に1兆2962億円に及び、国内の家庭用ゲーム市場全体の7割以上を占める※1に至っている。
その収益モデルは大きく5つに分類される。
フリーミアム(ダウンロード無料・アプリ内課金有)
有料アプリ (ダウンロード有料・アプリ内課金無・売り切り型)
ペイドミアム(ダウンロード有料・アプリ内課金有)
アプリ内広告(バナー広告、ビデオ広告など広告含有)
ダイナミック(ユーザーの利用状況にあわせて収益源を変動するビジネスモデル)
上記のうちアプリで最も多く採用されているビジネスモデルは(1)フリーミアムである※2。
そのためゲーム制作側は、いかに無料ユーザーに課金してもらえるきっかけを作るかと、いかに課金サービスの利用が見込めるユーザーを獲得するかに苦心している。
フリーミアムのスマホゲームでは、インストールをしてもすぐやめてしまうユーザーや、無課金でゲームを進めるユーザーが多数いる。そのためコンバージョンを「インストール」にしてPDCAを回しても、課金ユーザーは増えない可能性が高い。特にデジタル広告では、インストール止まりで課金サービスを利用しないユーザーも含めて増やすように最適化されるため、多額の広告費を投下している可能性が高い。
もしコンバージョンを「課金」にすれば、広告の費用対効果は大きく改善する可能性がある。
そこで問題となるのが、ユーザーが課金サービスを利用し始めるまでの期間である。ユーザーが実際に課金サービスを利用するまで待っていては時間がかかる。さらに、広告の最適化をかけるために必要な課金ユーザーのサンプル数を集めるにはさらに長い期間が必要となる。そこからデータを分析して広告に反映することを考えると、短期間でPDCAをまわすことは難しい。

その解決策として、インストール後から短期間のユーザー行動から、その後の課金行動を予測し、課金ユーザーを効果的に誘導できている広告を早期に把握、その分析結果を配信広告の運用に活用することで、広告のPDCAを高速化できると考えた。

予測は、行動データから2パターンの分析用データを作成し精度を比較した
ゲーム固有要素に依存しない一般的な特徴量のみの行動データ(ログイン回数・時刻、課金金額、デバイス種別、IPアドレスから推測された地理情報、ネットワーク回線種別、広告関連情報)
一般的な特徴量に加え、チュートリアルやイベント消化状況などゲーム固有要素を含んだ行動データ
本レポートでは断りがない限り(A)一般的な特徴量のみの行動データの予測結果を解説する。また、行動データがAndroidとiOSで別テーブルに保存されていたため、別々に予測した。
本分析に関しては、オプトと共同で行った。オプトでは、アプリの広告計測ツールであるadjustやAppsFlyerのシングルソースデータを蓄積できるSpinAppというプロダクトがある。SpinAppでは、どの広告からインストールされたか、インストールされた時刻、その後の起動や各種イベント時刻、端末種別、ネットワーク環境など、ユーザー予測を行うための様々な有益な情報が蓄積できている。
図3に示すように、インストール後から1週間の観察期間の行動データを用いて、その後4週間の予測期間の間にユーザーが課金行動を一度でも行うかどうか二値分類問題として予測した。
実際は5週間分の行動データを収集し、予測の正しさを評価するために使用した(ユーザー数はAndroidで233,521人、iOSで431,043人。内、約80%を訓練ユーザー、約20%を評価ユーザーとした。以下、実データと呼ぶ)。

以下のモデルを用いて課金ユーザー予測と合計課金金額の予測精度を比較した。なお、全ユーザー数に対する課金ユーザー数の割合はAndroidで3.12%、iOSで2.16%の不均衡データであったため、課金ユーザーのオーバーサンプリングを行った。
今回のような二値分類問題で用いられる基本的な分析モデル。計算時間が短く、ベースラインとして用いる。
2014年に登場し人気を集めている分析モデル。勾配ブースティングとランダムフォレストを組み合わせた手法で高い汎化能力を誇る。
Deep Neural Networkーいわゆるディープラーニング。データ量が多ければ多いほど精度の高い予測が期待できる。今回は4層の隠れ層を持つ多層パーセプトロンを利用した(各隠れ層の次元数は 1024、512、256、64 次元)。
ロジスティック回帰 | |
|---|---|
XGBoost | |
DNN |
それぞれの予測モデルの適合率(課金サービスを利用すると予測したユーザーが実施に課金サービスを利用した割合。precision、精度ともいう)を比較した(図4)。

3つのモデルを比較すると、プラットフォームに関わらずDNN(ディープラーニング)が正解率 94 % 程度を維持しつつ適合率が最も高かった。また、ランダム抽出と比較すると最大で9.03倍の適合率で課金ユーザーを特定できた。
同様の予測を(B)ゲーム固有要素を含んだ行動データでも行った。直感的には、チュートリアルやイベント消化状況などのゲーム固有要素によって、課金ユーザーの予測性能が上がるように思われる。しかし実際は、ゲーム固有要素がある場合と比べて、一般的な特徴量のみの予測の方が、同等かそれ以上の適合率が出ていることがわかった(図5)。

今回の予測データを、実際にGoogle広告にフィードバックする利点は2点ある。
ブランドサイトやアプリインストールページで離脱したアプリをインストールする可能性が高いユーザーの中から、より課金サービスの利用が見込めるユーザーを獲得するために広告配信の最適化がかけれられる
類似拡張により、通常のデータのフィードバックでは届かなかった課金サービスの利用が見込めるユーザーへのリーチが期待できる
上記施策を実施した際には改めて報告を行う予定である。
今回は二値分類を実施したが、回帰問題としてユーザ毎の合計課金金額も予測することが可能である。この場合、線形回帰や XGBoost、DNN などの手法を利用できる。
課金ユーザー予測は、広告配信以外にも以下のように利用することでLTVを最大化できる可能性がある。
課金サービスの利用が見込めるユーザーにクーポンを発行し課金のきっかけを作る
課金サービスの利用が見込めるユーザーをゲーム内イベントで優遇する
今回は単一の予測モデルを使い、かつ1週間の行動データから将来の課金額を予測したが、以下のような工夫を加えることにより、さらに精度を上げられる可能性がある。
1週間よりも長い期間のデータを使い予測する
DNNとXGBoostをアンサンブルする
自動ハイパーパラメータ最適化ツールなどを利用し、モデルを最適化する
今回の予測からゲーム固有の要素を利用しない一般的な特徴量のみでも一定の予測精度が示されたため、スマホゲーム以外の業界での応用も期待される。
たとえば、人材業界では求人の閲覧数やマイページへのログイン頻度により、その後に転職するかどうかを予測できる可能性がある。EC業界でもは、同様に、閲覧数やログイン頻度を用いてLTVの高い顧客を、また、金融業界では、クレジットカードの新規発行者の利用動向から、メインカードとしてくれるユーザーを予測できる可能性がある。
コンバージョン後の行動が重要な業界であっても、LTVを加味して施策を振り返る運用を行っている企業がどれだけあるだろうか。
今回のような予測モデルによる運用改善が技術的に難しい企業であっても、まずはLTVを加味して施策を振り返ることで、予算の使い方や業務フローを見直すことができるのではないだろうか。

本レポートをPDFダウンロードする
2025/11/5
SEO順位は生成AIの回答に関係するか?生成AIに「おすすめのパソコン教室を教えて」と質問。1,176回分の結果を比較検証
2025/4/24
「予算増額なき顧客」は事実、優先度が下がる。Web広告代理店の実態調査
2025/3/25
Webサイトの「フルリニューアル」は売上を伸ばすために本当に必要か
2024/12/6
WACULの研修はカスタマイズ性が魅力。実務に直結した内容設計でDXリテラシーの向上を実感 - 東急不動産ホールディングス株式会社 DX人材育成研修事例
PDF版でご覧いただけます
ダウンロードする