アメリカ最新AI情報満載!セミナーや講演情報など交えて毎週水曜配信 無料ニュースレター 下記へメールアドレスを入力し無料で登録
CLOSE
パロアルトインサイト/ PALO ALTO INSIGHT, LLC.
ブログBLOG
パロアルトインサイト/PALO ALTO INSIGHT, LLC. > ブログ > コールドスタート問題とは?商品レコメンドの新方法
コールドスタート問題とは?商品レコメンドの新方法
2021/12/15 ブログ, The Insight 
by kohei 

コールドスタート問題とレコメンドAI事例:LightFM「新規ユーザーにどのコンテンツをレコメンドすべきか?

シリコンバレーから現役データサイエンティストのインサイトをお届けする「The Insight」。今回は、ユーザーやアイテムのデータがない状態でもパフォーマンスを上げることを可能にするレコメンドアルゴリズムである「LightFM」についてご紹介します。

この記事から得られる3つのナレッジ

 

論文データ:
今回のディスカッション対象の論文をご紹介します。

タイトル:Metadata Embeddings for User and Item Cold-start Recommendations
『レコメンデーションにおけるユーザーとアイテムのコールドスタート問題のためのメタ情報の埋め込み』
著者:Maciej Kula, Lyst
掲載サイト:arXiv
発行日:2015年7月30日
引用数:169
URL:https://arxiv.org/abs/1507.08439

 

目次

コールドスタート問題とは何か
コールドスタート問題の解決策:ハイブリッドモデルの開発
モデル開発につながったLystの課題

LystでのLightFMの運用の特徴
LystでのLightFM開発後の効果

データサイエンティストによる論文についてのディスカッション

1. LightFMモデルにおけるメタ情報と行列分解の詳細
2. LightFMの画像データ活用方法について

AIビジネスデザイナーのワンポイントアドバイス

 

NetflixやAmazonなど数々のオンラインサービスに活用され、ユーザーにおすすめを提示するレコメンデーションエンジンは、ユーザーや商品に関する過去に蓄積したデータやその他関連データが増えれば増えるほど、予測の精度が上がり、ユーザーにより有益なおすすめが可能となる特徴があります。例えば、過去にNetflixで韓国ドラマを見たら、他の韓国ドラマがおすすめされるように、過去にユーザーがウェブサイト上でどのような行動を取ったのか、というデータはパーソナライズしたレコメンドをする上で大事な情報になります。

 では、「何をいいねしたか」「どんな商品を検索したのか」「誰が購入したのか」などのデータが一切蓄積されていない新規ユーザーや新商品(新アイテム)に対して、どのようにパーソナライズしたレコメンデーションを行うのでしょうか?その鍵が、あるイギリスのファッションECサイトが開発した手法「LightFM」にあるかもしれません。今回は、新しくウェブサイトを立ち上げた方、新しい商品やコンテンツをウェブサイト上で的確にレコメンドしたい方、新規ユーザーに何をおすすめすればコンバージョンが上がるのかに頭を悩ませている方に是非読んでいただきたい論文紹介です。

コールドスタート問題とは何か

ウェブサイト上でのコンテンツレコメンデーションの手法には、様々な種類があります。例えば、以下のような手法が挙げられます。

  1. 新着順や人気順にランキングを表示するもの
  2. 対象アイテムの特徴から、ユーザーの嗜好の傾向に合った特徴を持つアイテムをレコメンドする「コンテンツベース(内容ベース)フィルタリング」
  3. ユーザーの過去の行動履歴や他のユーザーの評価情報を活用する「協調ベースフィルタリング」

 フィルタリングとは、レコメンデーションとして何を推薦するか決定する仕組みを指します。これらはウェブ上での販売活動に欠かせない機能となっていますが、レコメンデーションに必要なデータが十分に集まっていない段階では、望まれる成果が上がらない「コールドスタート問題」が発生することが大きな課題になっています。

 例えば、あるユーザーの過去の購買履歴を参考にして、購買行動が似ている別のユーザーにおすすめすることでセレンディピティ(素敵な偶然に出会ったり、予想外のものを発見すること)につなげることができる「Collaborative Filtering(協調ベースフィルタリング)」というレコメンデーションの手法があります。ユーザーの過去の購買履歴を口コミのように扱うことで「この商品を購入した方は、次の商品も購入しています」といったおすすめを表示できますが、この手法は、ユーザーの過去の行動履歴を元にレコメンデーションをしているため、行動履歴がない新規のユーザーには、効果的なレコメンデーションができません。そのため、「協調ベースフィルタリング」では特に「コールドスタート問題」の影響を受けやすくなります。

 しかし、オンライン上のサービスでの新規ユーザーや新商品の追加は、ビジネスが発展すれば、必然的に発生します。加えて、成長や変化による新しいサービスの追加や、多様なサービスによるユーザーとアイテムの流動性の高まりなどもあるかと思います。また、コールドスタート問題が発生している状態は、レコメンデーションエンジンを採用しているにも関わらず、効果が上げられていない状態であり、さらには、ユーザーに関連性の低いレコメンデーションが表示される、同じような商品ばかり表示されるなど、効果の低いレコメンデーションは、顧客満足の低下にも繋がり、逆効果となる場合もあります。そのため、コールドスタート問題への対応ニーズが高まっています。

コールドスタート問題の解決策:ハイブリッドモデルの開発

 今回テーマとする論文の著者が所属するLystは、2010年にイギリスで設立されたラグジュアリーブランドの検索サイトを運営するファッション企業です。Lystのウェブサイトによると、同社のアプリは年間1億5000千万人ものユーザーを擁するほか、世界中の1万7,000のブランドから800万点もの商品を掲載しており、世界で1番ダウンロードされているということです。また、2020年には商品総価値が5億ドルを超え、新規ユーザーは1100%増加しています。また、スタートアップ系企業に投資を進めているLVMHが、約85億円のプレIPOの資金調達を主導したことでも話題になりました。日本へは2019年に進出しています。

Image by Lyst.com

 Lystでも急成長する会社として新規ユーザー数が増えることと、取り扱う商品の数が増えることというふたつの成長によって発生するコールドスタート問題を抱えていました。

通常、効果的にパーソナライズしたレコメンデーションを行えるまでユーザーのウェブサイト上でのクリックなどの行動データの蓄積を待つ会社も多い中、Lystではユーザーの属性、取り扱う商品のジャンル、キーワードなどといったメタ情報をMatrix Factorization(行列因子分解モデル:NetflixのレコメンデーションコンテストであるNetflix Prizeで最も成果を出したアルゴリズム)に組み込み、協調フィルタリングと、アイテム間の類似度に基づいてレコメンデーションを行うContents Based Filtering (コンテンツベースフィルタリング)の両方を活用したハイブリッドなアルゴリズムを開発することにより、ユーザーとアイテム双方のコールドスタート問題を解決することを試みました。

 その過程で開発されたのが「LightFM」というモデルです。Matrix Factorizationに類似していますが、ユーザーとアイテムのメタ情報を活用し、ユーザーとアイテム双方の「コールドスタート問題」を解決できることが主な相違点となります。また高精度で動作が軽く、Pythonのコードセットが準備されていることなどが高評価されています。

 LightFMの開発につながったLystの解決課題と実際の運用方法を論文から引用してご紹介します。

https://www.paloaltoinsight.com/membership-checkout/?level=4
https://www.paloaltoinsight.com/membership-checkout/?level=4

 PAIoneerPRO会員に登録 ▷ 
PAIoneer PRO
詳細はこちら

 会員の方はログイン▷ 

おすすめ/関連記事こちらの記事も合わせてどうぞ

パロアルトインサイトについて

AIの活用提案から、ビジネスモデルの構築、AI開発と導入まで一貫した支援を日本企業へ提供する、石角友愛氏(CEO)が2017年に創業したシリコンバレー発のAI企業。

社名 :パロアルトインサイトLLC
設立 :2017年
所在 :米国カリフォルニア州 (シリコンバレー)
メンバー数:17名(2021年9月現在)

パロアルトインサイトHP:www.paloaltoinsight.com
お問い合わせ、ご質問などはこちらまで:info@paloaltoinsight.com

石角友愛
<CEO 石角友愛(いしずみともえ)>

2010年にハーバードビジネススクールでMBAを取得したのち、シリコンバレーのグーグル本社で多数のAI関連プロジェクトをシニアストラテジストとしてリード。その後HRテック・流通系AIベンチャーを経てパロアルトインサイトをシリコンバレーで起業。データサイエンティストのネットワークを構築し、日本企業に対して最新のAI戦略提案からAI開発まで一貫したAI支援を提供。東急ホテルズ&リゾーツ株式会社が擁する3名のDXアドバイザーの一員として中長期DX戦略について助言を行う。

AI人材育成のためのコンテンツ開発なども手掛け、順天堂大学大学院医学研究科データサイエンス学科客員教授(AI企業戦略)及び東京大学工学部アドバイザリー・ボードをはじめとして、京都府アート&テクノロジー・ヴィレッジ事業クリエイターを務めるなど幅広く活動している。

毎日新聞、日経xTREND、ITmediaなど大手メディアでの連載を持ち、 DXの重要性を伝える毎週配信ポッドキャスト「Level 5」のMCや、NHKラジオ第1「マイあさ!」内「マイ!Biz」コーナーにレギュラー出演中。「報道ステーション」「NHKクローズアップ現代+」などTV出演も多数。

著書に『いまこそ知りたいDX戦略』『いまこそ知りたいAIビジネス』(ディスカヴァー・トゥエンティワン)、『経験ゼロから始めるAI時代の新キャリアデザイン』(KADOKAWA)、『才能の見つけ方 天才の育て方』(文藝春秋)など多数。

※石角友愛の著書一覧

NEWSLETTERパロアルトインサイトの
無料ニュースレター

毎週水曜日、アメリカの最新AI情報が満載の
ニュースレターを無料でお届け!
その他講演情報やAI導入事例紹介、
ニュースレター登録者対象の
無料オンラインセミナーのご案内などを送ります。

BACK TO BLOG
« »
PAGE TOP