登录
首页 » 算法 » C++ ItemCF

C++ ItemCF

于 2022-03-26 发布 文件大小:11.80 MB
0 152
下载积分: 2 下载次数: 1

代码说明:

UserCF和ItemCF是协同过滤中最为古老的两种算法,在top-N的推荐上被广泛应用。这两个算法之所以重要,是因为他们使用了两个不同的推荐系统基本假设。UserCF认为一个人会喜欢和他有相同爱好的人喜欢的东西,而ItemCF认为一个人会喜欢和他以前喜欢的东西相似的东西。这两个假设都有其合理性。根据我的测试,用UserCF和ItemCF做出的推荐列表中,只有50%是一样的,还有50%完全不同。但是这两个算法确有相似的精度。所以说,这两个算法是很互补的。我一直认为这两个算法是推荐系统的根本,因为无论我们是用矩阵,还是用概率模型,我们都非常的依赖于前面说的两种假设。如果用户的行为不符合那两种假设,推荐系统就没必要存在了。因此我一直希望能够找出这两种算法的本质区别。他们有相似的精度,但是coverage相差很大,ItemCF coverage很大而UserCF很小。我还测试了很多其他指标,不过要从这些表象的指标差异找出这两个算法的本质区别还是非常困难。不过上周我基本发现了这两个算法推荐机理的本质区别。我们做如下假设。每个用户兴趣爱好都是广泛的,他们可能喜欢好几个领域的东西。不过每个用户肯定也有一个主要的领域,对这个领域会比其他领域更加关心。给定一个用户,假设他喜欢3个领域A,B,C,同时A是他喜欢的主要领域。这个时候我们来看UserCF和ItemCF倾向于做出什么推荐。结果如下,如果用UserCF, 它会将A,B,C三个领域中比较热门的东西推荐给用户。而如果用ItemCF,它会基本上只推荐A领域的东西给用户。因为UserCF只推荐热门的,所以UserCF在推荐长尾上能力不足。而ItemCF只推荐A领域给用户,这样他有限的推荐列表中就可能包含了一定数量的不热门item,所以ItemCF推荐长尾的能力比较强。不过ItemCF的推荐对某一个用户而言,显然多样性不足。但是对整个系统而言,因为不同的用户的主要兴趣点不同,所以系统的coverage会很大。显然上面的两种推荐都有其合理性,但都不是最好的选择,因此他们的精度也会有损失。最好的选择是,如果我们给这个用户推荐30个item,我们既不是每个领域挑选10个最热门的给他,也不是推荐30个A领域的给他,而是比如推荐15个A领域的给他,剩下的15个从B,C中选择。认识到这一

下载说明:请别用迅雷下载,失败请重下,重下不扣分!

发表评论

0 个回复

  • 经常用的一些delphi数值方面的,只是一些,没有生成具体的程序。...
    经常用的一些delphi数值方面的算法,只是一些算法,没有生成具体的程序。-frequently used some delphi the numerical algorithm, but some algorithm, without generating specific procedures.
    2022-05-14 12:35:37下载
    积分:1
  • 用VB实现的蚁群,提供了多个经典的TSP路径
    用VB实现的蚁群算法,提供了多个经典的TSP路径-VB realize using ant colony algorithm, providing a number of classic TSP path
    2022-07-20 11:17:52下载
    积分:1
  • 毁伤效能程序
    本程序从杀爆弹实际毁伤过程出发,在前人提出的破片毁伤基础模型上,提出了针对地面人员目标的破片与爆炸冲击两种作用条件下综合杀伤概率的计算方法。并以某弹在攻击角度为65 º作为实例,对单发与多发弹在不同爆炸高度的综合杀伤概率进行了计算。结果表明,随着爆炸高度的增加,其杀伤概率整体下降,并且对于单发弹其杀伤概率等势分布区域发生变化,由椭圆形变成脚掌形。对于多发弹在相同爆炸高度条件下,其杀伤概率等势分布形状不变,但杀伤概率与分布面积随弹数的增加而增加。本程序的计算方法与结果可为杀爆战斗部的设计与实际应用提供参考。
    2023-06-29 20:45:02下载
    积分:1
  • 考拉兹猜想解决方案使用 c + +
    在这个程序中,证明具有难度声明解决了考拉兹猜想。为任何整数,不管它是什么,会最终导致一个人。它通常被称为合一的任何整数。此程序所示的此属性的一个整数。
    2022-02-06 10:43:19下载
    积分:1
  • 二ETAPA Java源代码
    应用背景下面的列表包含了近200个程序(有些是客户端,有些是基本的基础设施)。单击“程序名称”访问“爪哇代码”;单击“访问”的描述,并单击“数据文件名”访问数据。自我检验关键技术该应用程序加载。民众似乎是最好的如果你第一次去的第一个演示,从那里直接到二使用在网页端提供的链接。如果你从第一个演示到这个页面(带背面按钮),然后去二次演示,事情可能会卡住。停止,重装,访问其他页面,可能最终得到的东西装等。
    2022-10-06 12:05:03下载
    积分:1
  • c#学习资料
    c#,学习c#的比较较好的资料,拥有丰富的例子及详细的讲解,例子中对每一个步骤进行了详细的注解,以及详细的操作步骤,可帮助 广大学者进行c#语言的学习以及提升自身的知识。
    2022-03-24 04:09:04下载
    积分:1
  • svm实现多类分类
    支持向量机在数据挖掘方向的成功使得该项技术在很多实际领域中得到广泛应用,这套代码就是在通过MATLAB来实现svm的多分类,包括对数据的预处理,样本数据的训练和预测仿真。希望对初学者有帮助。
    2022-03-10 13:31:18下载
    积分:1
  • 读取segy的程序
    是一个读取segy的程序。需要一个输入的par文件来描述观测系统。结果输入为地震数据。
    2022-10-28 01:10:04下载
    积分:1
  • Ti DSP TMS320F280x ADC 的SOC例程。
    Ti DSP TMS320F280x ADC 的SOC例程。-Ti DSP TMS320F280x ADC routines of SOC.
    2022-01-27 17:40:56下载
    积分:1
  • GPS单点定位
    用于读取O文件以及N文件并根据相应公式进行伪距单点定位的程序,可以根据卫星广播星历文件和卫星观测值文件进行伪距单点定位的操作。相关文件可以到网上下载。
    2023-06-02 23:10:04下载
    积分:1
  • 696518资源总数
  • 106161会员总数
  • 5今日下载