登录
首页 » 算法 » C++ ItemCF

C++ ItemCF

于 2022-03-26 发布 文件大小:11.80 MB
0 55
下载积分: 2 下载次数: 1

代码说明:

UserCF和ItemCF是协同过滤中最为古老的两种算法,在top-N的推荐上被广泛应用。这两个算法之所以重要,是因为他们使用了两个不同的推荐系统基本假设。UserCF认为一个人会喜欢和他有相同爱好的人喜欢的东西,而ItemCF认为一个人会喜欢和他以前喜欢的东西相似的东西。这两个假设都有其合理性。根据我的测试,用UserCF和ItemCF做出的推荐列表中,只有50%是一样的,还有50%完全不同。但是这两个算法确有相似的精度。所以说,这两个算法是很互补的。我一直认为这两个算法是推荐系统的根本,因为无论我们是用矩阵,还是用概率模型,我们都非常的依赖于前面说的两种假设。如果用户的行为不符合那两种假设,推荐系统就没必要存在了。因此我一直希望能够找出这两种算法的本质区别。他们有相似的精度,但是coverage相差很大,ItemCF coverage很大而UserCF很小。我还测试了很多其他指标,不过要从这些表象的指标差异找出这两个算法的本质区别还是非常困难。不过上周我基本发现了这两个算法推荐机理的本质区别。我们做如下假设。每个用户兴趣爱好都是广泛的,他们可能喜欢好几个领域的东西。不过每个用户肯定也有一个主要的领域,对这个领域会比其他领域更加关心。给定一个用户,假设他喜欢3个领域A,B,C,同时A是他喜欢的主要领域。这个时候我们来看UserCF和ItemCF倾向于做出什么推荐。结果如下,如果用UserCF, 它会将A,B,C三个领域中比较热门的东西推荐给用户。而如果用ItemCF,它会基本上只推荐A领域的东西给用户。因为UserCF只推荐热门的,所以UserCF在推荐长尾上能力不足。而ItemCF只推荐A领域给用户,这样他有限的推荐列表中就可能包含了一定数量的不热门item,所以ItemCF推荐长尾的能力比较强。不过ItemCF的推荐对某一个用户而言,显然多样性不足。但是对整个系统而言,因为不同的用户的主要兴趣点不同,所以系统的coverage会很大。显然上面的两种推荐都有其合理性,但都不是最好的选择,因此他们的精度也会有损失。最好的选择是,如果我们给这个用户推荐30个item,我们既不是每个领域挑选10个最热门的给他,也不是推荐30个A领域的给他,而是比如推荐15个A领域的给他,剩下的15个从B,C中选择。认识到这一

下载说明:请别用迅雷下载,失败请重下,重下不扣分!

发表评论

0 个回复

  • 程序的要求是已知的,几个节点和节点的函数(×),…
    本程序的要求是已知几个节点x及节点函数f(x),要求近似函数!只要输出每点函数,对角线上的值,和最后一行的值,为继续插值准备! 例如:0.00 0.00000 0.20 0.20134 0.30 0.30452 0.50 0.52110 得到结果:0.00000 0.20134 1.006700 0.30452 0.083666 0.52110 1.082900 0.170333 0.173334 f(0.230000)=0.249337 Rx(0.230000)=-1.46917e-09f-the procedural requirements are known, several nodes and node x function f (x), requiring similar function! As long as output per function point, the value of a diagonal, and the last line of duty, prepared to continue interpolation! For example : 0.00 0.00000 0.20134 0.30 0.20 0.50 0.52110 0.30452 outcome : 0.00000 0.30452 0.20134 1.006700 1.082900 0.083666 0.52110 f 0.170333 0.173334 (0.230000) = 0.249337 Rx (0.230000) =- 1.46917e- 09f
    2023-02-16 14:55:03下载
    积分:1
  • 排队系统
    //#include"stdafx.h" #include < stdio.h > #include < tchar.h > #include < iostream > 使用命名空间 std ; int main) { //////////////////////////////////////////////////////// / / 初始化变量 / / int n = 0,n1 = 0 ;/ / 没有。就业机会 int maxLength = 0 ;/ / 最大长度队列。 浮
    2023-01-13 23:05:03下载
    积分:1
  • sefefsffesfsefsefsf
    esfsfsefrsdagsrdgsrv rafasrgrdsg ragdsagsardg, hsafuhkajsf., sferhfukjashfiagf.,asfgsra yfguasufv thsdhhgsdh rgsadgzdsrgrdasg rhrshwreygsd
    2022-03-16 05:26:36下载
    积分:1
  • os 银行家,共创 pthread 信号量
    银行家与 pthread, os 银行家、 共创 pthread、 信号量,os 银行家、 共创 pthread、 信号量
    2022-03-22 09:35:54下载
    积分:1
  • 李迷宫 vlsi 的路由
    迷宫路由算法试图找到在迷宫中单丝的两个点之间的最短路径,如果存在这种路径。在此方案中的源单元格将消息发送到它的四个邻国。消息传播到其他节点的波的形式。到达目的地的第一波前面确定的连接路径。在这种算法有两个阶段。在第一阶段节点都与他们的距离从源头的标签。在下一阶段的距离都用于跟踪从接收器到源选择与源的最小距离的路径。一般路由问题的一种方法是区域路由, 这是一单阶段的路由技术。 迷宫路由算法表示路由层作为一个网格,在那里每个差分可以包含到相邻的被连接。它搜索的源和目标节点之间的连接通过执行广度优先搜索和标签及其来源的距离每个网格点的最短路径连接。如果连接是可能的这种扩张阶段将最终会到达目标节点。然后第二次的攻击源追踪阶段通过以下任何路径与降低标签形成连接。这种算法被保证能够找到源和给定连接的目的地之间的最短路径。然而,当多个连接发生了一个连接可能会阻止其它连接
    2023-04-12 03:55:03下载
    积分:1
  • 遍历二叉树
    代码实现了二叉树的生成和搜索。希望对正在学习算法的同学们提供便利。
    2022-03-23 21:59:18下载
    积分:1
  • 这里面是关于电气常用公式计,对电子电气类学习参考有一定的价值...
    这里面是关于电气常用公式计算,对电子电气类学习参考有一定的价值-There is a commonly used formula of electrical, electronic reference Electric learning has its value
    2022-03-17 22:45:04下载
    积分:1
  • 结合实例用VB编程表达了一阶偏微分方程的数值解,希望能为您提供一点帮助。...
    结合实例用VB编程表达了一阶偏微分方程的数值解法,希望能为您提供一点帮助。 -with examples using VB expression of an order partial differential equations of the numerical method, we wish to offer you some help.
    2022-04-01 14:46:50下载
    积分:1
  • mfc写的五子棋源码
    通过MFC写的五子棋源码,有兴趣的欢迎交流              对算法和界面,相关源码应有尽有                     哈哈,还等什么,快下载把        嗯。。。。      
    2022-12-03 23:55:03下载
    积分:1
  • IF97水和水蒸气性质计C源码
    水和水蒸汽作为一种重要工质,在电站热能动力工程上有着广泛的应用。德、俄、英、加等7国12位科学家组成的联合研究小组提出了一个全新水和水蒸汽计算公式,在1997年德国Erlanger召开的水和水蒸汽性质国际联合会(IAP WS)上通过并发表,称为IAPWS-IF97公式。根据IF97的文档,自己编写的C代码
    2022-01-31 11:22:35下载
    积分:1
  • 696522资源总数
  • 104046会员总数
  • 29今日下载