登录

最新会员 最新下载

成为了本站VIP会员

04月26日 23:14

成为了本站VIP会员

04月25日 21:33

成为了本站VIP会员

04月23日 14:46

成为了本站VIP会员

04月18日 20:09

成为了本站VIP会员

04月18日 18:37

成为了本站VIP会员

04月18日 18:25
已选条件
  1. 编程语言:Hadoop
  2. 代码类别:Java
  3. 发布时间:不限
全部撤销
编程语言 更多 收起
代码类别 更多 收起
发布时间
更多选项

1. SolrMongoImporter-master

连接 HBASE和MongoDB的驱动程序,配置后可直接导数据。很好用。

2
下载
50
浏览
2023-09-04发布

2. java版kmeans算法以及mapreduces实现

java实现kmenas算法,有详细的注释,以及MapReduce实现Kmeans算法。 Map每读取一条数据就与聚类中心对比,求出该条记录对应的聚类中心,然后以聚类中心ID为key,该条数据为value将数据输出  利用Reduce的归并功能将相同的key(聚类中心ID相同)归并到一起,集中与该Key对应的数据,求出这些数据的平均值,输出平均值  对比Reduce求出的平均值与原来的聚类中心,如果不相同,将清空原中心的数据文件,将Reduce的结果写到中心文件中

1
下载
79
浏览
2023-03-18发布

3. web访问记录分析

基于hadoop的web访问记录分析,主要实现:1.页面访问量统计 2.页面独立IP的访问统计  3.用户每小时PV的统计  4.用户来源域名的统计 5.用户的访问设备统计

2
下载
84
浏览
2023-02-16发布

4. 图像文件转换为MapReduce可以读写的二进制文件代码

Hadoop的计算框架只能处理文本文件,对于图像数据不能直接处理,本代码可以实现将图像文件转换成Mapreduce可以读取的SequenceFile,其中包括单机写入和读取,以及mapreduce读取,是进行分布式处理图像数据的第一步。

2
下载
97
浏览
2022-11-14发布

5. hadoop 计算平均成绩

用于计算学生的平均成绩,采用的平台是hadoop分布式平台,代码语言是java,这是一个比较基础的hadoop入门的例子,有助于新手熟悉mapreduce原理,难度会比Wordcount大一点点,但基本原理类似,都只需要一个map函数,一个reduce函数。

2
下载
94
浏览
2022-10-14发布

6. hdfs文件系统操作

提供的是Hadoop系统中的HDFS文件系统的上传下载文件,以及对文件进行操作的的Java代码。提供的是Hadoop系统中的HDFS文件系统的上传下载文件,以及对文件进行操作的的Java代码。提供的是Hadoop系统中的HDFS文件系统的上传下载文件,以及对文件进行操作的的Java代码。提供的是Hadoop系统中的HDFS文件系统的上传下载文件,以及对文件进行操作的的Java代码。

1
下载
111
浏览
2022-05-21发布

8. Hadoop2.0入门案例

Hadoop2.0.入门案例。很实用,想要学习大数据的同学抓紧,里面有自己的学习心得!

1
下载
119
浏览
2022-03-23发布

9. 分析部门员工的情况

1) 求各个部门的总工资 2) 求各个部门的人数和平均工资 3) 求每个部门最早进入公司的员工姓名 4) 求各个城市的员工的总工资 5) 列出工资比上司高的员工姓名及其工资 6) 列出工资比公司平均工资要高的员工姓名及其工资 7) 列出名字以J开头的员工姓名及其所属部门名称 8) 列出工资最高的头三名员工姓名及其工资 9) 将全体员工按照总收入(工资+提成)从高到低排列,要求列出姓名及其总收入 10) 如果每位员工只能和他的直接上司,直接下属,同一部门的同事交流,求任何两名员工之间若要进行信息传递所需要经过的中间节点数。

1
下载
183
浏览
2022-03-14发布

10. mahout实战中k-means源码

mahout是一个开源的机器学习平台!mahout实战这本书详细的讲解了mahout的原理并且介绍了相应算法的实例。本文件包含了该书的相应实例的相应源码。

1
下载
124
浏览
2022-03-11发布

11. HBase增删改查等相关操作

代码中利用Hbase相关的API,包括对HBase的增删改查等操作,对于初学者学习HBase能够起到作用。 前提是导入hadoop和hbase相关的jar包,可以在hadoop集群上面下载

2
下载
126
浏览
2022-02-26发布

12. hadoop-workCount-源码

hadoop2.5.1-workCount-源码,导入eclipse可直接运行。有需求的可以一起研究一下。

1
下载
133
浏览
2022-02-25发布

13. 日志合并代码

将电信实时日志  根据正则提取 然后通过mr合并,按类区分。 第一类:2016-06-02 23:44:32[02 00:27:16,496 INFO ] - [Topic2Queue.java]-[com.tydic.rtaBc.msgPrep.Topic2Queue$TopicThread]-[run]-[140] -  [消息发送完成****开始时间:1464798436495 结束时间:1464798436496 发送耗时毫秒:1 消息内容:PROD_OFFER_STRA_INST_553#|20160602002715000#|1588772703#|2#|2#|553#|52404686#~256902779#~0#~1763220#~20120829000000#~20170731000000#~48819113#~#~0#~1#~55302972867#~#~24#~1000#~553#~20120829175149#~#~20120829175102#~1#~11] 103002103002009103002009001Topic2Queue174_58_61134.64.115.174file 第二类:[0624 17:12:40 047 INFO ] com.tydic.rtaBc.msgPrep.MsgPrep -  [@PH] [2016-06-24 17:12:40] [40-92815B5A8001-RTA1-29928958696021756] [P_1_MR] [1] [OFFER_PROD_INST_REL_554#|20160624170210000#|823943705#|1#|2#|554#|179490421#~286955326#~277480107#~554#~20160624170210#~20160624170210#~555913462#~A1#~286955326#~0#~#~#~#~#~70911#~12#~0#~0]  第三类:103002103002009

1
下载
113
浏览
2022-02-04发布