あんしん・あんぜんのための自動違反検知
Last Updated :
Summary
メルカリでは、月間2000万人以上のアクティブユーザーが行う出品や取引を、機械学習ベースのContents Moderaton Systemで監視し、あんしん・あんぜんなマーケットプレイスの実現に貢献しています。
Purpose
メルカリでは、日々多くの個人間取引が行われています。その取引の中には、法令に違反する出品やお客さまの行動も含まれています。マーケットプレイスの信頼性・安全性を維持するためには、そのような違反行為を日々監視し、必要に応じて対応せねばなりません。すべての出品やお客さまの行動を手作業で監視できれば確実ではあるのですが、コスト的に困難であるため、機械学習を用いて効率的に出品や取引の監視を行うことが必要とされています。
Description
メルカリではあんしん・あんぜんなマーケットプレイスの実現に向けて、違反出品物の検出・削除を行っています。カスタマーサポートのオペレータが手動で作成した検知ルールに加えて、過去の違反出品物のデータを利用した機械学習のモデルも利用しています。
違反出品物検出のモデルは、違反出品のカテゴリーに応じて作成しています。例えば、ブランドの偽造品の出品物を検出するモデルや法律で売買が禁止されている銃などの武器を検出するモデルなどがあります。これらのモデルは独立に学習・運用されています。
モデルによって違反と判定されたものは、その後、カスタマーオペレータの目視チェックが行われ、最終的に人間による削除判断がなされます。
現在 Content Moderation Systemの開発チームでは下記のような技術的課題に取り組んでいます。
- マーケットプレイスの出品傾向が時々刻々と変わるため、定期的に最新のデータを使って再学習させる必要があります。これを効率的に実現するためのシステムの作成に取り組んでいます。
- 学習に使うデータのラベルはノイズが含まれています。また一部にのみラベルが付いており、ラベルの無いデータも含まれています。そのようなデータでも学習できるようなシステムの構築に取り組んでいます。
- マルチモーダルなモデルの開発に取り組んでいます。マーケットプレイスに出品される商品はテキスト・画像・商品に対するメタデータなど様々なデータがあるため、これらを効果的に使う方法を模索しています。