-
scala实现的KMeans算法
spark下用scala实现的KMeans算法,注释多,可运行
- 2022-02-03 13:29:47下载
- 积分:1
-
spark-fpgrowth
Spark.mllib 提供并行FP-growth算法,这个算法属于关联规则算法【关联规则:两不相交的非空集合A、B,如果A=>B,就说A=>B是一条关联规则,常提及的{啤酒}-->{尿布}就是一条关联规则】,经常用于挖掘频度物品集。关于算法的介绍网上很多,这里不再赘述。主要搞清楚几个概念: 1)支持度support(A => B) = P(AnB) = |A n B| / |N|,表示数据集D中,事件A和事件B共同出现的概率; 2)置信度confidence(A => B) = P(B|A) = |A n B| / |A|,表示数据集D中,出现事件A的事件中出现事件B的概率; 3)提升度lift(A => B) = P(B|A):P(B) = |A n B| / |A| : |B| / |N|,表示数据集D中,出现A的条件下出现事件B的概率和没有条件A出现B的概率; 由上可以看出,支持度表示这条规则的可能性大小,而置信度表示由事件A得到事件B的可信性大小。 举个列子:10000个消费者购买了商品,尿布1000个,啤酒2000个,同时购买了尿布和啤酒800个。 1)
- 2022-06-16 09:01:41下载
- 积分:1
-
Spark机器学习源码
说明: Spark 机器学习代码,有大量机器学习算法实例。(Spark machine learning code, there are a large number of machine learning algorithm examples.)
- 2020-09-27 16:39:19下载
- 积分:1
-
1
说明: 深入理解Spark核心技术书籍,书籍对spark进行了深入讲解,并对spark源码进行了剖析(In-depth understanding of Spark core technology books, books on Spark in-depth explanation, and analysis of spark source code)
- 2020-06-18 10:40:02下载
- 积分:1
-
xgoktnou
本系统用于所有的Web应用程序,如网站管理后台,网站会员中心,CMS,CRM,OA。(This system is used for all Web applications, such as website management backstage, website member center, CMS, CRM, OA.)
- 2018-10-16 22:42:11下载
- 积分:1
-
spark源码
Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。Spark是UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室)所开源的类Hadoop MapReduce的通用并行框架,Spark,拥有Hadoop MapReduce所具有的优点;但不同于MapReduce的是Job中间输出结果可以保存在内存中,从而不再需要读写HDFS,因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的MapReduce的算法。
- 2022-04-27 01:47:32下载
- 积分:1
-
dbscan-on-spark-master
在 spark大数据集群环境下,用于数据聚类分析结果(In spark environment, cluster analysis results)
- 2017-11-29 21:04:09下载
- 积分:1
-
Scala语言入门第三周
scala语言入门的相关知识,分享给大家(Introduction knowledge)
- 2020-06-22 12:20:01下载
- 积分:1
-
1doppler_satellite
说明: 基于低轨卫星的频偏估计算法,用matlab实现,估计精度较高(frequency offset estimation on satellite)
- 2019-12-26 21:56:02下载
- 积分:1
-
照片无损压缩软件
照片无损压缩软件能将一个文件夹下所有图片进行同时压缩,可以按百分比进行压缩,也可指定图片的宽和高进行压缩,可以生成缩略图。
菜单功能:
1、选择图片所在路径
2、选择将图片保存到指定文件夹
3、缩略图设置:百分比、指定高、指定宽、指定高宽
- 2022-01-25 17:28:05下载
- 积分:1