推荐系统召回算法:Swing算法
Swing 算法广泛用于推荐系统的召回阶段,本文将介绍 Swing 算法的原理和实现。
ItemCF 算法可能存在的一个问题
ItemCF 算法在计算两个物品的相似性时认为:两个物品的受众重合度越大,两个物品的相似度越大。但是这种假设在实际应用中可能存在“小圈子”问题,举例来说:当两个不太相似的物品被转发到同一个微信群中时,这两个物品同时被群友点击,这样就会导致这两个物品的相似度很高,但是这两个物品实际上并不相似。

Swing 算法
Swing 算法的基本思想是:如果大量用户同时喜欢两个物品,且这些用户之间的重合度很低,那么这两个物品一定很相似。
将用户
如果
将喜欢物品
其中
Swing 算法在实际应用中的完整流程与 ItemCF 算法类似,只是在计算物品相似度时使用了 Swing 算法的公式。
总结
- Swing 算法与 ItemCF 算法的唯一区别在于计算物品相似度的公式不同。
- ItemCF 算法:两个物品的受众重合度越大,两个物品的相似度越大。
- Swing 算法:额外考虑了重合用户是否来自于一个小圈子,如果是,则降低这些用户的权重。
参考资料
Enjoy Reading This Article?
Here are some more articles you might like to read next: