-
数据挖掘决策树Java源代码
资源描述决策树是建立在信息论基础之上,对数据进行分类挖掘的一种方法。其思想是,通过一批已知的训练数据建立一棵决策树,然后利用建好的决策树,对数据进行预测。决策树的建立过程可以看成是数据规则的生成过程。由于基于决策树的分类方法结构简单,本身就是人们能够理解的规则。其次,决策树方法计算复杂度不大,分类效率高,能够处理大数据量的训练集;最后,决策树方法的分类精度较高,对噪声数据有较好的健壮性,符合一般系统的要求。
- 2022-03-12 14:04:11下载
- 积分:1
-
贝叶斯网络 R语言实例 牛津大学
说明: R语言构建贝叶斯网络,很实用的讲解和案例(Construction of Bayesian network with R language, a very practical explanation and case)
- 2020-06-19 18:26:44下载
- 积分:1
-
nirtg
分而治之方法与软件设计的模块化方法非常相似,为了解决一个大的问题,可以: 1) 把它分成两个或多个更小的问题; 2) 分别(The divide-and-conquer approach is very similar to the modular approach to software design. To solve a big problem, you can: 1) divide it into two or more smaller problems; 2))
- 2018-09-04 05:12:14下载
- 积分:1
-
TurbulentWindGenerator
三维风场模拟.利用Kaimal spectrum结合FFT进行风场模拟,生成风速时程得进行必要参数的定义。(3D Turbulent Wind Generation。 Generation of three-dimensional turbulent wind fields, by employing a Kaimal spectrum and IEC-based coherence function. )
- 2017-02-28 11:35:25下载
- 积分:1
-
PCA
一个用python实现的PCA算法,并且给了简易素材(A PCA algorithm implemented in python, and gave a simple material)
- 2020-08-23 14:38:17下载
- 积分:1
-
python 实现随机森林
应用背景
数据 :两个月之内 40000个客户的15个数据字段 包含客户的 地 理位置,职业,职级,年收入,。。。。。。 购买过得产品
目的:对新客户进行推荐一个适合该客户的产品, 对老客户推荐可能再购买的产品
数据处理
数据清洗: describe 每个特征统计分析 方差 -分析缺陷特征和波动性
空值赋值为 “-1 “ - 保证模型的可使用
数据归一化:eg:邮编 相似度不高 根据一线二线….进行划分 – 特征的重要性
关键技术特征选择
随机森林: 判断特征的重要性 :思考为何重要性高
AHP : 迭代设置每个特征的权重
模型选择 :根据数据量数量,是否有标签,分类or回归选取
关于模型选择时候我想用协同过滤 但是不知道关于特征的协同过滤是怎么执行的 是每个特征都有一个评分构成评价矩阵么?
- 2022-02-25 17:28:51下载
- 积分:1
-
PCA
说明: python PCA算法原理推导,及源代码实现,并基于PCA算法实现图片压缩,附pdf文件说明(Python PCA algorithm principle derivation, and source code implementation, and based on PCA algorithm to achieve image compression, with PDF file description)
- 2021-02-09 12:04:01下载
- 积分:1
-
python疫情数据可视化
说明: 通过时事数据可视化系统,可以清楚地了解全球疫情分布的状况以及密度,以便做出相应的对策(Through the current affairs data visualization system, it is possible to clearly understand the distribution and density of the global epidemic in order to make corresponding countermeasures)
- 2021-03-05 10:19:31下载
- 积分:1
-
AP聚类
说明: 实现了无监督AP聚类 其优势在于不用知道聚类个数(The advantage of unsupervised AP clustering is that the number of clusters is not known)
- 2020-08-13 18:05:48下载
- 积分:1
-
频繁项集挖掘算法
频繁项集挖掘算法,能在大量局部特征中发现频繁空间配置,这些空间配置可以作为词语,加入到特征包中进行分类,实现图像分类。
- 2022-03-23 21:38:47下载
- 积分:1