-
BayesSpam-master
基于朴素贝叶斯的垃圾邮件分类,包含算法代码,邮件数据集以及中文停用词文件(Spam classification based on Naive Bayes, including algorithm code, mail dataset and Chinese stop word file)
- 2018-10-14 14:25:40下载
- 积分:1
-
使用Xgboost进行kaggle比赛的python代码(附带数据)
使用xgboost对于Kaggle入门比赛泰坦尼克问题进行了分析的python代码,代码具有很强的摸板性。
- 2023-04-20 16:35:03下载
- 积分:1
-
Assignment2_santosh.tar
Image analysis to create a histogram in python language
- 2012-04-28 23:09:20下载
- 积分:1
-
ATR价格突破策略
ATR价格突破策略,非常好用,免费提供给大家(ATR price breakthrough strategy, very useful, free to everyone)
- 2020-06-20 16:40:02下载
- 积分:1
-
python从入门到实践及书本源代码
python编程:从入门到实践,高清pdf书本,以及原书代码,有需要的可以下载学习
- 2022-07-15 13:58:46下载
- 积分:1
-
databricks-spark-reference-applications.pdf.tar
摘要: 现有的聚类算法比如
CluStream 是基于 k-means 算法的。这些算法不能够发现任
意形状的簇以及不能处理离群点。
解决上述问题,本文提出了
而且, 它需要预先知道
k 值和用户指定的时间窗口。
为了
分将数据映射到一个网格,
D-Stream 算法,它是基于密度的算法。这个算法用一个在线部
在离线部分计算网格的密度然后基于密度形成簇。
度衰减技术来捕获数据流的动态变化。
为了探索衰减因子、 数据密度以及簇结构之间的关系,
我们的算法能够有效的并且有效率地实时调整簇。
群点的稀疏网格是合理的,
算法采用了密
而且, 我们用理论证明了移除那些属于离
从而提高了系统的时间和空间效率。
该技术能聚类高速的数据流
而不损失聚类质量。 实验结果表明我们的算法在聚类质量和效率是有独特的优势,
并且能够
发现任意形状的簇,以及能准确地识别实时数据流的演化行为(Abstract: Existing clustering algorithms such as CluStream are based on the k-means algorithm. These algorithms can not be found
Meaningful clusters and can not handle outliers. To solve the above problems, this paper presents)
- 2017-09-03 11:05:23下载
- 积分:1
-
tensorflow-knn-双向LDA
说明: 基于LDA的人脸降维,精度比二维LDA的要高,有一定的运用价值。(orl tensorflow LDA PCA)
- 2019-06-06 10:17:58下载
- 积分:1
-
社交网络的可视化
# GVBDgbbd是一个基于spark的大规模社交数据分析工具,提供了FR布局算法和k-friend layout算法(原创),并提供了相应的统计分析和聚类工具。详情请看作品说明文档和系统安装文档。
- 2022-02-03 10:47:47下载
- 积分:1
-
EKF-python code
本代码为基于扩展卡尔曼滤波的多传感器融合程序仿真,内附数据。(This code is a simulation of multi-sensor fusion program based on extended Kalman filter, with data attached.)
- 2020-06-16 15:20:02下载
- 积分:1
-
GMM聚类
GMM聚类实现,利用jupybook实现出来,可以看算法的实现原理。(GMM clustering implementation, using jupybook realization, can see the implementation principle of the algorithm.)
- 2020-06-18 23:20:02下载
- 积分:1