Blog
メルカリAIチームと半熟仮想株式会社らの共同研究論文「Counterfactual Learning with General Data-generating Policies」がAAAI 2023に採択されました
概要
この度、メルカリAIチームのエンジニア清水 亮洋と半熟仮想株式会社創業者・イェール大学助教授の成田 悠輔氏らによる共著論文「Counterfactual Learning with General Data-generating Policies」が 人工知能分野の国際会議AAAI 2023の本会議に採択されたことをお知らせいたします。
AAAI(Association for the Advancement of Artificial Intelligence)は、人工知能分野における最も権威のある学会の一つであり、開催37回目である今年のAAAI 2023は、アメリカ合衆国の首都ワシントンD.C.で2023年2月7日から14日まで開催されます。2023年度は37回目の開催で、8,777本の投稿の中から1,721本の論文が採択されています(採択率19.6%)。
発表時間は、下記のスケジュールを予定しています。
2023年2月12日(日)午後2時00分 〜 3時15分 (GMT-5)
発表内容のポイント
Counterfactual Learning with General Data-generating Policies
- 非確率的な方策を含む幅広いクラスの既存方策に適用可能な方策外評価(Off-policy Evaluation)の手法を提案
- アルゴリズムが自然に生成したデータを用いてアルゴリズムを改善する手法を開発
- 提案手法を使ってメルカリ におけるクーポン配信方策を分析、過去データを用いてクーポン施策の効果を測定可能に
研究の背景
アルゴリズムによる意思決定を行う上で重要なのが、まだ使われたことのない新しい意思決定アルゴリズム(方策とも呼ばれます)の性能を予測することです。しかし古いアルゴリズムと新しいアルゴリズムをランダムにユーザーに割り当てて比較するA/Bテストでは、開発工数がかかってしまったり、新しい機能を享受できないユーザーがいることで、一部ユーザーにとって不公平な状況が発生して不満につながる可能性があります。
そこで、古いアルゴリズムが自然に生成したデータだけを用いて新しいアルゴリズムの性能推定しようとする営み「方策外評価(Off-policy Evaluation)」を用いてこの問題を解決することが重要になります。しかし、現在の方策外評価の技術では、クーポン配布アルゴリズムのような非確率的な方策には使用することが難しいことが知られていました。
研究概要
そこで、我々はクーポン配布アルゴリズムのような非確率的な方策を含む幅広い既存方策にも適用可能な新しい方策外評価の手法を提案しました。
本提案手法は、アルゴリズムが意思決定を行った場合、そこから生成されたデータには、自然実験がほぼ必ず含まれるという観察に基づいて開発されています。たとえば、クーポン配布アルゴリズム等で使用される教師付き学習の場合、予測された何らかの変数がある基準値を上回るかどうかでクーポンを配布するかなどの意思決定が行われることが多いですが、基準値の前後では、ほぼ同じ状況であるにもかかわらず、基準値を上回ったかどうかという一点のみで異なった結果と判断され、意思決定が行われてしまいます。我々の提案手法ではこういった偶然の要因によって生まれる意思決定の差異を局所的な自然実験とみなし、新しい方策の性能比較に使用します。
実際にメルカリ上のデータを用いることで、提案した手法が実データ及びA/Bテストの課題を現実問題上で解決できることを検証しました。提案手法を用いることで、A/Bテストではなく、方策外評価によって新しいクーポンの性能やそのビジネスインパクトを見積もることが可能になります。
MDS Teamについて
MDS(マーケティングデータサイエンス)チームでは、統計学、機械学習、数学的最適化を用い、マーケティングキャンペーンの効率を向上させることを目的としています。
半熟仮想株式会社について
データ・アルゴリズム・数理・思想を組み合わせ、事業や政策、そして社会の未来像をデザインするスタートアップ。「市場設計」「反実仮想機械学習」「因果推論」を強みとし、多数の企業との共同事業・研究や独自の基礎研究・ソフトウェア開発などを行う。
今回の共同研究には同社創業者でイェール大学助教授の成田 悠輔氏、ノースウェスタン大学経済学部PhD課程の奥村 恭平氏、ウィスコンシン大学マディソン校助教授の矢田 紘平氏の3名が参加。