Algorithm-Assisted库存管理

瑞安·道尔顿,马特·伯吉斯,妮米什·帕蒂尔,还有琼·安德鲁斯
——加利福尼亚州旧金山

大规模的个性化时尚需要我们建立一个和我们的客户群一样庞大和复杂的库存。为了支持我们的库存扩展和更广泛的供应链管理,Stitch Fix开发了一套算法,作为一个新的库存推荐系统。在这篇博文中,我们将描述如何构建这个推荐系统,从数据源到核心模型。接下来,我们将介绍推荐系统在整个供应链上的集成,包括增强库存管理、人工智能辅助设计、快速供应商评估和为客户服务提升奖助金与师徒计划

构建大规模个性化的原材料

通过造型和收集反馈的过程,Stitch Fix建立了匹配客户库存的专业知识。但是我们只能设计库存中已经存在的项目。因此,库存管理是我们供应链管理方法的一个基本组成部分。但这本来就很困难:时尚,以及我们客户的品味,都在不断变化。我们的客户群一直在增长。我们该如何管理数以千万计的商品库存,服务于庞大而多样的客户群体?

我们推断,如果我们能预测哪些项目将表现良好,与谁合作,我们可以大大提高我们的商品投资。同时,这些预测可以帮助我们更可持续:服装制造是资源密集型的,数据驱动的采购可以帮助我们避免制造过程中的浪费,无论是内部还是外部。为了满足这些需求,我们建立了一个新的商品推荐系统,能够准确预测不同客户群体的商品表现。为简单起见,我们将此推荐系统称为“风格的探险家”。

数据和数据预处理

在我们的建模框架中,我们将每一件新的商品称为“原型商品”,以便将我们的候选商品与现有库存区分开来。为了对给定的原型商品进行推断,我们首先需要赋予它功能。我们使用了广泛的特征类型,从人类分配的分类数据,到照片图像,到织物属性,再到自然语言。这些数据源是由业务伙伴或算法组的研究团队在整个组织中独立开发的。为了让我们的特性在这种情况下是可伸缩的,我们使用了一系列自定义的“扩展器”,每个扩展器都独立地获取属性,然后将它们强制转换成一种通用的数据格式。

许多最重要的商品属性是无法从形象中推导出来的。例如,这种面料感觉如何?在Stitch Fix,这些元数据是由我们的买家和他们合作的供应商提供的。这使得我们的买家成为创建原始商品数字指纹的基础部分;它还为我们的商品建模工作提供了丰富的数据源。

另一个强大的功能集来自我们内部的计算机视觉服务。通过使用一个“图像扩展器”,我们的特点是高质量的原型摄影棚图像。这使我们能够标准化和测量原始商品的调色板。但它也允许我们收集图像嵌入,然后可以用来衡量,例如,在原始商品和现有商品之间的织物切割相似性,我们有大量的性能数据。最后,为了测量一件物品的即时情感共鸣,我们利用了Style Shuffle应用程序下游生成的客户-物品嵌入。通过推断这些嵌入,我们对趋势的演变和客户的偏好获得了有价值的见解。

上图:样式资源管理器架构。培训数据是从整个组织的独立数据源中收集的。在模型训练之前,我们的特征条目将进行一轮降维。在部署模型之前,我们评估它的性能,如下所示。然后,每个模型都被存储并通过模型管理层路由到用例。

总的来说,我们的核心模型使用了超过500个特性,成千上万的不同风格,以及数千万的客户端交互。这个特征空间非常稀疏,要求我们在核心模型训练之前降低数据的维数。为了降维,我们使用了一种轻微定制的统一流形近似和投影(UMAP)应用程序,我们使用它将约500维降至8维。我们使用UMAP而不是像LDA或t-SNE这样的方法来保存特征空间中的近距离,这恰好符合我们对不同商品之间如何关联的直觉理解。例如,对于模型来说,Rocker和Heritage之间的差异不如蓝色格纹Heritage和绿色格纹Heritage之间的差异重要。然后,我们使用这个降维数据集训练许多不同的模型架构,每个架构都有优化的超参数。然后用面向业务的度量对这组模型进行评分(见下面),这样不同的模型就可以针对不同的业务用例进行生产。

风格Explorer评价

风格的探险家公司的绩效是持续和仔细的评估,这个评估过程需要重要的监督。这次投资的最清晰的理由是,一个业绩不佳的模式可能对业务造成重大损害。然而,尽管这一说法似乎显而易见,但它提出了一系列问题,而答案却并非如此。为了阐明为什么我们认为模型评估在任何机器学习项目中都是至关重要的,并指导其他人通过这个通常是模糊的过程,下面我们概述了在模型部署之前我们回答的一些问题。

首先,我们如何选择有意义的性能指标?传统的ML度量,如均方误差(MSE),可能很容易计算,但对于非平凡的用例,它们有关键的缺陷。最重要的是,MSE没有告诉我们任何关于建模性能中模型开始增加业务价值的阈值的信息。事实上,对于一些模型相关的过程来说,任意小的MSE可能会带来严重的危害。出于这个原因,我们强烈提倡使用自定义的面向业务的指标,而不是传统的ML指标。

其次,为了理解性能,我们需要理解我们的模型可能被部署到的环境。风格的探险家主要是为了增加库存管理;因此,为了理解它的影响,我们需要了解在没有模型集成的情况下,我们的库存管理得有多好。虽然构建这种环境具有挑战性,但它也迫使业务合作伙伴和数据科学家之间保持一致,这最终会减少对无法生产的项目的投资。

第三,我们应该用什么样的分辨率来评估模型的性能?这是一个很重要的问题,因为具有强大顶线参数的模型可能在特定领域表现不佳。我们是一家成长中的公司,正在向更多的细分客户和更多的业务渠道扩展;因此,我们部署模型的决策过程和用例的数量正在迅速增长。因此,我们需要一种系统地、持续地监控我们所影响的决策以及这些决策的战略重要性的方法。

为了解决这些问题,我们使用了模型管理层,并且在任何模型部署之前,我们使用自定义的面向业务的指标来评估模型的性能。为风格的探险家,每个指标都是通过模拟实际购买过程中常见的选择点来度量的。换句话说,我们的买家对购买哪种印花、图案和轮廓做出了具体的决定,我们应该根据他们做出这些决定的能力来评估我们的模型。下面,我们将详细概述这个过程。

模拟购买过程

为了总结我们购买模拟的方法,我们询问了我们的库存在上个季度的表现如何,如果我们使用了购买建议风格的探险家.我们强烈提倡这种反事实的方法,既便于沟通,又与商业伙伴关心的财务指标一致。

为了使我们的方法更具体,我们首先需要描述购买过程的某些方面。买家的工作被组织成我们所说的“商品节点”,或我们的库存的特定子集。例如,一个买家可能负责“男士高价牛仔裤”,另一个可能负责“女士针织上衣”。在每个商品节点,买家利用他们的专业知识和趋势建立一个既全球成功又专注于公司战略举措的库存。

上面是一个模拟分类的例子。在每个“商品节点”中,Style Explorer预测每个道具的性能,对它们进行排名,然后使用它们的排名来决定每个道具的购买量。然后计算新的模拟库存的性能指标,并与实际库存进行比较。

在将库存划分为商品节点后,我们在每个商品节点中计算每种使用的商品的预测成功指标风格的探险家.然后,我们使用这些预测的成功指标来实际干预购买过程,例如购买更多数量的某些物品,而购买更少数量的其他物品。最后,我们根据总体成功、产生的收入和其他关键业务指标来衡量这个模拟库存的表现。

这种干预帮助我们发现商品节点和特定的决策点风格的探险家可以增加价值。但是它还没有将我们的建模性能上下文化。为了做到这一点,我们再次执行上述模拟,但这一次我们根据每个项目的实际成功来移动量。我们再次测量了这个新的模拟商品节点的性能。从本质上说,这第二次干预就像一个“水晶球”估计,给我们一个可以用完美模型添加的价值上限的测量值。通过比较这两种估计,我们确定了我们具有良好预测能力的商品节点;但我们也会在离天花板很远的地方找到节点。这些节点通常为未来的建模改进提供了良好的ROI,特别是当节点覆盖了大量商品或对公司具有高度战略重要性时。

上图:对于每一类物品,我们计算模拟分类的性能指标。我们将这些参数与使用“完美”模型设置性能上限的模拟结果进行比较。像A类这样的项目类具有很强的升力,是模型部署的好候选者。像Class C这样的项目类,我们看到的只是边际提升,但性能上限很高,这是进一步改进建模的很好的候选者,例如通过更好的类特征。

上面给出的例子只是最简单的库存模拟类型,但它已经近似于我们的买家所做的受限决策。我们可以进一步将这些模拟扩展到更具体的问题,包括“我应该购买模式X还是Y ?”以及“这些产品中哪些最能吸引特定的客户群体?”“因此,通过执行这一整套模拟,我们能够为特定的用例计算出我们的建模性能的现实估计。重要的是,这些仿真指标能够极大地区分聚合ML指标相同的模型的性能。因为这个事实,我们的模拟度量对于模型管理是非常重要的,帮助我们选择哪个模型是根据哪个用例生产的。

集成和用例

风格的探险家的项目级性能预测可以被我们的算法合作伙伴用作数据源,也可以被我们的业务合作伙伴用作可操作的洞察力。这给了风格的探险家广泛的集成潜力,可以推动跨功能协作,并在业务功能之间校准激励措施。此外,正如风格的探险家利用更多的用例,对其功能的任何扩展都将影响到每个用例风格的探险家的整合点。这些品质给风格的探险家并概述了最大化Stitch Fix数据科学投资价值的路线图。由于这些原因,我们将在结束时重点介绍几个风格的探险家应用程序,强调使这些应用程序成为可能的架构原则。

用于人工智能辅助设计的风格浏览器

在传统的零售业中,为了了解一件商品的销售情况以及与谁合作,需要对该商品进行设计、制作、质量控制、分销和分销等等。简而言之,任何新商品的设计和销售之间的反馈循环都是资源、时间和劳动密集型的。因此,如果我们能够及早做出人工智能辅助的设计决策,我们就可以更可持续地生产商品,同时降低成本。与此同时,我们可以在缩短上市时间的情况下获得竞争优势。出于这些原因,Stitch Fix正在投资风格的探险家AI-assisted设计。

在实践中,我们的设计师可以使用风格的探险家通过裁剪、印花和图案的组合进行迭代,并询问哪一种组合会成功。这种方法不仅使抽象意义上的人工智能辅助设计成为可能;它允许我们利用数据为特定的市场或客户群体设计服装。换句话说,风格的探险家在商品被制造、分配和销售之前,就可以用来评估商品的性能。

面向供应商的样式管理器

风格的探险家的核心应用是为我们的买家提供预测商品成功跨越不同的客户群体。因此,通过将这些预测扩展到整个商品组合,我们可以使用风格的探险家为特定品牌提炼理想目标市场的主题。换句话说,我们可以用风格的探险家了解我们的供应商,即我们所销售商品的设计师和制造商的影响。

更进一步说,我们可以想象这些投资组合水平。风格的探险家报告中包含了内部和外部的用例。对于面向内部的用例,这些报告可以帮助我们衡量新供应商在我们的生态系统中的影响。例如,我们可以了解一个供应商的投资组合将在多大程度上扩大我们的总体分类多样性或我们对战略客户群体的渗透。然后,这些信息可以用来驱动我们应该与哪些供应商合作的决定,以帮助我们实现特定的增长目标。

相反,在面向外部的用例中,风格的探险家报告可用于为供应商快速构建产品市场适用性报告,帮助他们设计销售、投资和营销策略。从本质上说,这些报告将充当供应商增值服务,用我们的数据科学工具授权外部供应商,并帮助他们使用数据来推动自己的业务增长。

作为我们供应商增值服务用例的一个强有力的早期验证,风格的探险家在我们的提升奖助金和导师计划中得到了广泛的利用。该项目旨在帮助bipo旗下的时尚公司成长、支持和指导。对于这个项目,一个令人鼓舞的假设是,对于设计师和供应商来说,才华和成功之间的传统道路可能天生就有偏见。如果是这样的话,那么采用数据驱动的方法来理解产品与市场的契合度,以及直接提供指导、资金支持和咨询支持,可能会在人才与成功之间建立一条新的、更直接的路径。

作为Elevate项目的一部分,我们的Elevate受让人将与算法组和我们的营销团队密切合作。当受让人设计和迭代时,我们将使用风格的探险家不断评估产品市场是否适合他们的投资组合。因此,风格的探险家将被整合到设计、迭代和战略投资的反馈循环中。这一方法将帮助我们为每个受让人确定最佳的目标市场。最终我们希望这种使用风格的探险家作为供应商增值服务,我们的Elevate受让人将帮助他们发展业务和分类。但通过打破传统的成功之路,我们也希望建立一个更公平的零售格局。

未来的发展方向

上面描述的每个用例都能够独立地增加价值。例如,我们新的商品推荐系统将增加我们的购买力,同时提高制造的可持续性。同样,战略性的供应商培训将帮助我们增加优先客户细分市场的渗透率。但我们相信风格的探险家美国的实力来自其作为核心能力的作用。因此,我们将根据……讨论未来的方向风格的探险家公司在整个供应链的整合。

广泛集成的一个明显好处是,开发新的算法能力需要大量的时间和劳动。鉴于这一事实,很明显,为了证明数据科学投资的合理性,我们需要了解它们增加业务价值的潜力。但同样显而易见的是,最有效的数据科学投资是那些可以广泛利用的投资。在设计算法系统以及理解这些系统的价值时,这种考虑是至关重要的。

构建核心能力的一个不太明显的好处是,每一个微小的改进都会在所有其他集成系统中被放大。例如,如果风格的探险家如果只针对新商品推荐进行部署,那么对核心模型的微小改进就会有有限的价值。但是因为风格的探险家是广泛部署,那小小的改进会在各地产生反响风格的探险家它将增加我们的供应商增值服务的价值,并将提高我们的准确性与人工智能辅助设计。

最后,风格的探险家作为一个核心能力的角色,有助于推动整个供应链管理系统的一致。作为一家企业,我们的目标是大规模地实现个性化,这意味着投资新产品,这将允许我们扩大我们的总目标市场。但是,如果我们还没有为新的客户群体提供商品,我们如何为他们提供服务呢?同样地,是否建议购买对我们现有客户不感兴趣的新产品?这个先有鸡还是先有蛋的问题需要一个综合的解决方案:我们需要同时投资新的商品和新的客户群体。风格的探险家,通过告知我们购买的商品和与我们合作的供应商(通常是我们服务的目标客户),我们就提供了这样一个集成的解决方案。换句话说,风格的探险家就像一套新的装备,帮助我们认识最真实的自己。

发布的这篇文章! 文章在LinkedIn
188滚球注册平台

来和我们一起工作吧!

我们是一个多元化的团队,致力于打造伟大的产品,我们希望您的帮助。你想和优秀的同行一起开发优秀的产品吗?加入我们吧!

Baidu