1.推荐系统的作用
随着信息技术和互联网的发展,我们已经进入一个信息过载的时代。在这个时代,无论是信息消费者还是信息生产者都遇到了巨大的挑战,即如何生产和获取适合的信息,都是一件困难的事情,而基于数据分析的推荐系统则是解决这一挑战的重要利器。所谓推荐系统,就是通过对用户的购买,访问等信息进行分析,从中识别出用户的偏好,从而建立起用户同信息之间的关系,将用户感兴趣的信息推送给该用户。
在电子商务行业,推荐系统不单单可以更好地帮助商家进行热门产品的销售,更多的在于挖掘商品的长尾,从而实现更多的冷门商品销售。但就商品而言,那些冷门的长尾商品往往只代表了一小部分用户的个性化需求,只有通过对用户兴趣的充分分析,才能更好的挖掘出商品的需求,最终提升这些产品的销售情况。
推荐系统,主要是通过对用户访问、浏览和购买产品等行为进行分析,从中识别出用户的商品偏好,帮助电子商务商家进行更为个性化的产品推荐,在这个过程中,数据分析起到了关键性的作用。我们通过数据分析,去识别用户的行为以及其同产品之间的关联性,将适合的产品在适合的时间,通过便捷的操作方式提供给适合的用户。
2.冷门商品的推荐
就现在情况来看,当前最为普遍的商品推荐主要是利用产品之间的关联性进行推荐。比如用户去电商网站点击浏览了A商品,那么电商网站立即基于产品之间的关联性,将具有高关联度的产品B推荐给该用户。但在传统的关联算法中,当A和B同为热门商品时,商品本身购买的次数就很多,商品A和B的支持度较高,商品A和B之间的关联性就更加容易被发现;反之,如果商品A或者B是一件冷门商品,它们之间的支持度可能较低,但一旦它们之间有着较强的置信度,可以确认两者之间有着较强的关联性,进行冷门商品的推荐,对于用户和商家来说,都是更有意义的。但在实际的挖掘过程中,这些冷门商品的关联分析,由于购买记录数量较少,传统的关联算法可能难以实现对于冷门商品关联性的挖掘,也给我们的冷门商品的推荐带来了不小的难题。
对于冷门商品的推荐,我们需要人工的去从数据出发,通过不断探索数据之间的关系,去更好地找到关联产品,并基于规则进行计算。很多我们事先设定好的规则,在这里的效果都不是太好,它更倾向于通过人的思维去逐步发现蕴含着数据之间的蛛丝马迹。JMP,作为SAS(全球最大的统计学软件公司)推出的一种交互式可视化统计发现软件系列,强调以统计方法的实际应用为导向,交互性、可视化能力强。我们借助JMP强大的数据交换能力,可以实现对于海量数据的探索性数据分析,帮助我们快速地进行数据分析工作,更为重要的是,JMP的交互性可以满足我们对于数据分析的种种要求,实现从未知到已知,从多到少,逐步识别各种商品之间的关系,更好地进行商品关联分析。
图:利用JMP的图形生成器进行图形化的探索性分析
3.用户的分类及识别
除了利用产品之间的关联性进行产品推荐之外,利用用户之间的关系进行产品推荐也是一种重要的产品推荐方式。当我们认定A用户同B用户是具有相同偏好的用户时,如果A用户成功购买过A商品,我们即可将A商品也推荐给B用户。通过分类,我们可以很好地识别用户,进而实行更有针对性的产品推荐,但现在的问题是我们面临的商品分类和数量超乎我们的想象,商品之间的特性不尽相同,一个普遍性的用户分类难以应用于所有商品的推荐,即A和B用户都是40岁左右已婚中年妇女,但A用户爱好文学,平时喜欢看文学小说,B用户热衷理财投资,关注投资理财知识的学习,她们之间的收入也存在较大差异。我们只有在确定各类商品特性的情况下,基于商品的特性再进行分类属性的选择,才能为每一类商品的客户选择提供更为准确的依据。但实现情况下,商品种类太多,用户人群太大,都成为阻碍我们进行精细客户分类的障碍。JMP提供的分割(即决策树)平台,可以基于任意目标变量,进行基于关键因子的用户筛选,帮助我们快速找到区分客户的关键因素,实现基于不同问题的快速用户分类。
图:基于分割(即决策树)平台的客户分类
4.其他规则的发现
除了商品和用户之间的关系之外,用户对于信息需求的时间,获取的方式等等规律也是推荐系统需要关注的问题。只有将这些因素更好的结合到一起,用户才能更好的响应我们的推荐,而这些都依赖于数据分析的作用。