ZOZO研究所、ファッションの流行変化を検証する 大規模データセットと実装基盤をオープンソースとして公開 〜 実データを活用し、分布シフト研究の促進を目指す 〜

f:id:starttoday_tech:20210826160417p:plain

株式会社ZOZOテクノロジーズ(本社:千葉県千葉市 代表取締役社長:久保田竜弥、代表取締役CINO:金山裕樹)の研究開発組織「ZOZO研究所」は、当所研究員が研究において使用している大規模データセット「Shift15M」および実装基盤をオープンソースとして公開したことをお知らせいたします。

「Shift15M」は、ファッションアプリ「IQON」(※1)に投稿されたコーディネート(※2)を基に構成された大規模データセットです。本データセットは、IQONのサービス提供期間である2010年から2020年までに投稿されたコーディネート約255万件のほか、これらのコーディネートを構成する約1,500万件(※3)のアイテムに関する特徴量、アイテムカテゴリに関するデータやコーディネート投稿への「いいね」数などの関連データも含みます。

併せて公開する実装基盤では、コーディネートデータの年ごとに異なる傾向を認識し、その変化によって生じるデータ分布のシフトを再現実験で確認することが可能です。これによって、年々変化するファッションの流行をより正確にとらえ、研究の更なる発展に役立てることができます。また、回帰問題、分類問題、集合マッチングなど、データ分布のシフトが生じる条件のもとで様々なタスクを検証するためのコードが整備されています。

データセット公開の背景

当所では、「ファッションを数値化する」をミッションとして掲げ、ZOZOグループが保有する豊富なデータ資産を基に研究開発に取り組んでいます。その中の1つとして、ファッションの流行が変化しても、継続的に認識精度を高く保つことができるAI技術の実現を目的に研究を進めております。

ファッションに関連するデータは、流行の変化による影響を受け、分布シフトと呼ばれる数理的現象が生じると考えられています。

分布シフトは流行や時間等の変化に伴って入力データの分布が変化することで生じ、ファッションに限らず多くの分野に共通して現れる現象とされています。この分布シフトによって、AIの認識精度が低下すること
近年注目を集めています。

f:id:starttoday_tech:20210826160411p:plain

分布シフトの検証は、AI技術の実用性にかかわる重要なテーマである一方で、検証に用いる実用的なデータセットの不足により、学術界における当該分野の研究の進展はこれまで制限されてきました。

そこで、分布シフト研究の発展を支える新たな研究基盤として、当所が保有する実データで構成された大規模データセット「Shift15M」と実装基盤を公開することを決定いたしました。

本データセットと実装基盤はファッションに限らず幅広い分野での活用が可能です。分布シフトの再現実験と典型的なタスクにおける効果検証や比較検証など、目的に合わせてご使用いただけます。 

なお、本データセットを使用した研究結果をまとめた研究論文である「SHIFT15M: Multiobjective Large-Scale Fashion Dataset with Distributional Shifts」はarXivにて公開しております。 

今後の展望

本データセットは、当所が昨年公開した「Open Bandit Dataset」に続くオープンデータプロジェクトの第二弾です。本データセットを公開することで、データの分布シフトが起こることによって生じる新たな課題を見出し、解決策を探るための研究開発を促進する一助となることを目指しています。

当所では今後も学術界や産業界への積極的な技術貢献を行うとともに、より利便性の高いサイトの構築とサービスの向上を目指し、研究開発に努めてまいります。

データセットおよび実装基盤の取得先

データセットおよび実装基盤:https://github.com/st-tech/zozo-shift15m
データセットの概要説明:https://research.zozo.com/data.html#Shift15mDataset

データセットの詳細

1) アイテムの特徴量
2) コーディネートに含まれるアイテムの情報
3) アイテムやコーディネートの付加情報 
   3.1) 投稿日時
   3.2) 「いいね」の数 
   3.3) ジャンル・カテゴリ
   3.4) 統計情
   3.5) 人間が付与したラベル(学習のための教師信号など)

ZOZO研究所について

ZOZO研究所は、「ファッションを数値化する」をミッションに掲げるZOZOグループの研究機関です。ZOZOグループが保有するファッションに関する膨大な情報資産を基に、ファッションを科学的に解明するための研究開発を行っています。

■所名 : ZOZO研究所(ZOZO RESEARCH)
■設立 : 2018年1月31日
■拠点 : 東京、福岡
■URL : https://research.zozo.com/

(※1)ファッションアプリ「IQON」は提携する200以上のECサイトのファッションアイテムを、ユーザーが自由に組み合わせてコーディネートを作成できるスマートフォンアプリです。2020年4月にサービスを終了しています。
(※2)公開するデータは商品やユーザーの特定が不可能なよう十分に匿名化しており、利用規約とプライバシーに配慮しています。
(※3)データに収録されるアイテム数の詳細は下記となります。
・コーディネートの数:2,555,147
・コーディネートを構成するアイテム数(重複あり):15,218,721
・コーディネートを構成するアイテム数(重複なし):2,335,598 

【本リリースに関するお問い合わせ】
株式会社ZOZOテクノロジーズ広報への問い合わせはこちら