为什么人们不会卖一些与自己购物搜寻预期有所不同的东西?这是一个有一点思维的问题。Alexa 购物团队负责管理搜寻功能的高级经理 Liane Lewin-Eytan 在自己的博客中说明道:比如,人们对 Alexa 收到搜寻指令,通过购物搜索算法,Alexa 最后不会罗列出有一些产品可供用户挑选出,那些能满足用户市场需求的产品可以解读为“涉及产品”。而这些“涉及产品”的最后呈现出依赖人工注解员的辨别。简而言之,人工注解员会标记出有合乎用户预期的涉及产品,而其他产品则为不涉及产品。
有意思的是,亚马逊方面最近找到,用户常常不会与注解员标记为不相关的产品产生联系。荐个例子,人工注解员会将“出售汉堡”的词条与汉堡产品联系一起,而不是将该词条与“汉堡机”联系一起,但亚马逊找到,收到“出售汉堡”这一指令的用户可能会卖看起来牵涉到的汉堡机,并会卖确实的汉堡。
(公众号:)录:上图来自 Amazon亚马逊将用户的这种不道德展开了分类,第一种是必要出售不涉及产品,就像前面荐的汉堡机的例子;第二种是与不涉及产品“对话”,例如将不涉及产品加到到购物车,或是共享给其他用户。亚马逊的研究指出,在面临销量低的或者是更为低廉产品时,用户出售不涉及产品的可能性更高;而且,比起起美容产品和杂货产品类别,人们在诸如玩具和数码产品等类别中出售不涉及产品的可能性更大。为了更进一步理解用户的这一不道德,亚马逊研究人员做出了许多希望。
首先,研究团队用于统计资料方法来辨识长短不一的关键词的搜寻结果。研究找到,比起起中等长度的搜寻关键词,通过结尾/比较冗长的关键词搜寻的用户在购买决策方面更为灵活性。因此,他们指出,较短关键词回应用户的不确定性和探寻的意愿,宽关键词不会减少准确给定的可能性;这两种方式都会让用户与不涉及产品产生关联的可能性减小。
另外,研究人员还考虑到了搜寻结果中涉及产品和不涉及产品之间的间接关系。例如,两个产品是完全相同风格、品牌或类别,或者它们常常是设施出售的,那么,它们之间就不存在着间接关系。研究人员用于了两种有所不同的间接关系度量方法,一种基于描述性术语的含义,另一种基于出售历史。这两个因素都会影响用户出售不涉及产品的可能性。
上述大都是数据统计资料方面的分析,亚马逊还展开了两次实验,以评估搜寻结果中看起来不相关的产品的价值。首先,研究人员展开了 1500 次搜寻查找,每次查找都记录一个涉及产品和一个不涉及产品,并考虑到了对这些产品应用于五种有所不同自由选择策略的结果。第一种策略,即“拟合策略”,一直自由选择需要带给更高的出售水平或参予水平的产品。
(参予水平/出售级别是参予不道德/出售不道德与数据样本中的所有交互的比率。)另外四种分别是“涉及策略”,即自由选择涉及产品;“不涉及策略”,即自由选择不涉及产品,“随机策略”,即在两种产品中随机自由选择,“最好策略”,即自由选择不会减少参予水平/出售水平的产品。
录:pRatio 是出售水平,eRatio 是参与度水平从右图的表格中可以显现出,比起起通过拟合策略和涉及策略自由选择的商品(没误差),其余策略自由选择的商品在出售水平和参予水平方面都具有极大的差距。在另一个实验中,研究人员用于完全相同的 1500 个查找来训练三种有所不同的机器学习模型:一种自学最大化相关性,第二种自学最大化出售水平,第三种自学仅次于参予水平。在此基础上,亚马逊建构了两个融合模型,一个融合了关联模型和参予模型,另一个融合了关联模型和出售模型,而且,还可以对每个融合模型展开调优,为构成该模型的两个模型的输入分配有所不同的权重。
例如,在关联出售融合模型中,将关联和出售级的权值分别设置为 1 和 0,设置之后,该融合模型将只产生关联模型输入;将融合模型的权重都设置为 0.5 将不会获得两个模型输入的均匀分布混合。对于这两个融合模型,亚马逊设置了一系列的权重并绘制了结果。于是以如上图右图,相关性和出售水平/参予水平之间不存在权衡:提升或减少关联性将不会影响出售水平/参予水平的展现出。亚马逊回应,如果搜寻结果无法符合客户的市场需求,但看上去是涉及的,客户可能会解读并原谅这种严重不足。
与此同时,出售水平/参予水平代表了一种更加主观的相关性类型,人工注解员无法评估这种相关性,这也有可能造成无法引荐出有令人满意的产品。目前,亚马逊用来评估相关性和出售/参予水平之间权衡的模型还非常坚硬,一个更加简单更加强劲的机器学习模型需要取得更佳的结果,尤其是如果它被具体地训练来评估一些确认的因素,例如关键词长度、价格和间接关系等。了解到,在 2 月份将要举办的 ACM Web 搜寻和数据挖掘会议上,亚马逊将更进一步展出这项研究的成果。原创文章,予以许可禁令刊登。
下文闻刊登须知。
本文来源:必威·BETWAY体育-www.jcbxdc.com