-
K-Means算法 mapreduce
public class KmeansMapper extends MapReduceBase implements
Mapper {
// one coodinate(data)
private List coordinate = new ArrayList();
private BasicKMeansTool basicKmeans = new BasicKMeansTool();
public void map(LongWritable key, Text value,
OutputCollector midoutput,
Reporter arg3) throws IOException {
// TODO Auto-generated method stub
String line = value.toString();
String[] dataList = line.split(",");
List distances = null;
StringTokenizer itr;
for (int i = 0; i < dataList.length; i++) {
itr = new StringTokenizer(dataList[i]);
&nbs
- 2023-02-01 17:45:04下载
- 积分:1
-
camshift+kalam目标检测
资源描述基于vS2010的opencv的camshift+kalam算法检测动态目标进行跟踪
- 2022-01-31 20:05:39下载
- 积分:1
-
Extended Kalman Filter
Extended Kalman Filter-code
- 2022-04-22 22:38:45下载
- 积分:1
-
Calculation of the intellectual questions: In this multiplication formula, each...
计算这个智力题:
在这个乘法算式里,每一个字母代表着0-9中的一个数,不同字母代表不同数。
A B C D E F G H
* A J
---------------------
E J A H F D G K C
B D F H A J E C
---------------------
C C C C C C C C C
请问,C 代表哪个数字?-Calculation of the intellectual questions: In this multiplication formula, each letter represents a number 0-9, different letters represent different number. ABCDEFGH* AJ--------------------- EJAHFDGKCBDFHAJEC--------------------- CCCCCCCCC Will, C Which figure is the representative?
- 2022-10-07 11:25:03下载
- 积分:1
-
classical mathematical problem
经典的数学问题――百鸡问题的VC源码。-classical mathematical problem-- the 100 chicken VC source.
- 2022-04-12 21:59:53下载
- 积分:1
-
根据ASCII码输出汉字的一个程序!!希望对大家有所帮助
根据ASCII码输出汉字的一个程序!!希望对大家有所帮助
- 2022-09-19 17:05:03下载
- 积分:1
-
This is a compiler for a small pascal procedures it is not enough for some but a...
这是一个用来编译pascal的一个小程序有些还不行但也发了-This is a compiler for a small pascal procedures it is not enough for some but also made a
- 2022-02-05 02:30:56下载
- 积分:1
-
一个用C编写的小波变换源代码,有兴趣的可以看一下
一个用C编写的小波变换源代码,有兴趣的可以看一下-a C prepared by the wavelet transform source code, interested parties can see what
- 2022-11-05 08:25:03下载
- 积分:1
-
C++ ItemCF
UserCF和ItemCF是协同过滤中最为古老的两种算法,在top-N的推荐上被广泛应用。这两个算法之所以重要,是因为他们使用了两个不同的推荐系统基本假设。UserCF认为一个人会喜欢和他有相同爱好的人喜欢的东西,而ItemCF认为一个人会喜欢和他以前喜欢的东西相似的东西。这两个假设都有其合理性。根据我的测试,用UserCF和ItemCF做出的推荐列表中,只有50%是一样的,还有50%完全不同。但是这两个算法确有相似的精度。所以说,这两个算法是很互补的。我一直认为这两个算法是推荐系统的根本,因为无论我们是用矩阵,还是用概率模型,我们都非常的依赖于前面说的两种假设。如果用户的行为不符合那两种假设,推荐系统就没必要存在了。因此我一直希望能够找出这两种算法的本质区别。他们有相似的精度,但是coverage相差很大,ItemCF coverage很大而UserCF很小。我还测试了很多其他指标,不过要从这些表象的指标差异找出这两个算法的本质区别还是非常困难。不过上周我基本发现了这两个算法推荐机理的本质区别。我们做如下假设。每个用户兴趣爱好都是广泛的,他们可能喜欢好几个领域的东西。不过每个用户肯定也有一个主要的领域,对这个领域会比其他领域更加关心。给定一个用户,假设他喜欢3个领域A,B,C,同时A是他喜欢的主要领域。这个时候我们来看UserCF和ItemCF倾向于做出什么推荐。结果如下,如果用UserCF, 它会将A,B,C三个领域中比较热门的东西推荐给用户。而如果用ItemCF,它会基本上只推荐A领域的东西给用户。因为UserCF只推荐热门的,所以UserCF在推荐长尾上能力不足。而ItemCF只推荐A领域给用户,这样他有限的推荐列表中就可能包含了一定数量的不热门item,所以ItemCF推荐长尾的能力比较强。不过ItemCF的推荐对某一个用户而言,显然多样性不足。但是对整个系统而言,因为不同的用户的主要兴趣点不同,所以系统的coverage会很大。显然上面的两种推荐都有其合理性,但都不是最好的选择,因此他们的精度也会有损失。最好的选择是,如果我们给这个用户推荐30个item,我们既不是每个领域挑选10个最热门的给他,也不是推荐30个A领域的给他,而是比如推荐15个A领域的给他,剩下的15个从B,C中选择。认识到这一
- 2022-03-26 08:57:57下载
- 积分:1
-
zoj 1015简单解法及证明!另附几道zoj题解法
1015虽然是到很简单的题,但这个算法巧妙的运用了数论中的一个小知识点,使得算法变得更快且更简单。简直让人拍手称快!
还有几道其他的zoj题。适合初学者的题。大牛们可以绕道。
- 2022-03-07 15:02:55下载
- 积分:1