摘 要: | 淘宝网站能够收集到海量用户的购物行为日志,它使得掌握用户的购物偏好成为了可能。尽管用户的购买模式具有高度的多样性和自由性,但是周期性的购买是非常频繁的现象。因此寻找用户的周期行为对了解用户对商户的偏好非常重要。本文基于2017年阿里巴巴竞赛所获得的数据,从海量的购物行为数据中挖掘了用户特征、商户特征和用户-商户特征,对寻常情境下新用户未来在同一家店铺再次购买行为的预测进行了研究。此外,针对训练数据中类别及不平衡的问题,提出随机抽样并赋予各类别不同权重相结合的策略,并基于该策略将训练样本划分为6组,分别用SVM与随机森林训练多个预测模型。最后,通过集成将这多个预测模型共同进行预测。通过实验验证,所提出的组合预测方法具有很高的有效性。
|