Blog
メルカリAIチームの研究「Improving Visual Recommendation on E-commerce Platforms Using Vision-Language Models」がRecSys 2025 に採択されました
概要
この度、メルカリAIチームのエンジニア・矢田宙生, 秋山翔, 渡邊諒, 上野湧太, 紫藤佑介, Andre Rusliによる論文「Improving Visual Recommendation on E-commerce Platforms Using Vision-Language Models」が、「RecSys 2025(ACM Conference on Recommender Systems)」のIndustry Trackの口頭発表(Spotlight Paper)に採択されたことをお知らせいたします。
RecSys(ACM Conference on Recommender Systems)は、推薦システム分野の世界最高峰会議(トップカンファレンス)であり、世界中の研究者らによって毎年開催されています。開催19回目である今年のRecSysは、チェコのプラハで2025年09月22日から26日まで開催されます。
2025年度のRecSysのIndustry Trackは、149本の投稿の中から55本の論文が採択されています(採択率36.7%)。更に本論文は、採択論文の中でも特に優れた研究として、15本のSpotlight Oral Presentationに選出されました(Top 10.1%)。
発表内容のポイント
今回の発表では、メルカリの商品ページ内の「見た目が近い商品」という推薦機能の裏側で動いている画像AIモデルを改善したプロジェクトについて報告します。
メルカリが保有する膨大な商品データを用いて学習したAIモデルを用いて、「見た目が近い商品」のレコメンド性能を大幅に向上させました。
研究の背景
お客さまからは「この服のデザインが気に入ったから似ているデザインの洋服が欲しい」「大好きなキャラクターの商品がメルカリで売られてないか」といった、ある商品の視覚的な特徴を用いた発見体験に一定の需要が存在していました。
メルカリでは、これまでも画像検索・推薦をはじめとした視覚的特徴を活用した発見機能を提供していました。しかし、その裏側のAIモデルは、メルカリの商品データを学習しておらず、画像の特徴を十分に捉えられていないという課題がありました。
研究概要
今回報告するプロジェクトでは、メルカリが保有する約100万件の商品データを用いて、Vision Language Modelと呼ばれる画像とテキストの両方の理解に優れたAIモデルの学習を行いました。
構築したAIモデルによって、
- 「見た目が近い商品」機能のクリック率が50%増加
- 商品ページのレコメンド経由での購入数が14%増加
という非常に顕著な改善が見られました。本発表で報告するAIモデルは後々、画像検索機能にも用いられています。
Recommendation ML Teamについて
Recommendation Teamでは、メルカリアプリにおける各画面(ホーム画面、商品詳細画面など)で提供されている推薦機能を通して、お客さま体験を向上することを目的としたチームです。今回の研究のような類似商品の推薦に加え、Two Towerモデルを用いたホーム画面の商品推薦や、バンディッドアルゴリズムによるレイアウトの最適化など、高度なAI技術を駆使して、様々な改善を日々行っています。
AI/LLM Teamについて
AI/LLM Teamでは、LLMやEmbeddingといった先端的なAI技術を活用したプロダクトの改善を通して、お客さま体験の向上に貢献することを目的としたチームです。画像検索やAI出品のような機能の開発をリードしています。