-
python 实现随机森林
应用背景
数据 :两个月之内 40000个客户的15个数据字段 包含客户的 地 理位置,职业,职级,年收入,。。。。。。 购买过得产品
目的:对新客户进行推荐一个适合该客户的产品, 对老客户推荐可能再购买的产品
数据处理
数据清洗: describe 每个特征统计分析 方差 -分析缺陷特征和波动性
空值赋值为 “-1 “ - 保证模型的可使用
数据归一化:eg:邮编 相似度不高 根据一线二线….进行划分 – 特征的重要性
关键技术特征选择
随机森林: 判断特征的重要性 :思考为何重要性高
AHP : 迭代设置每个特征的权重
模型选择 :根据数据量数量,是否有标签,分类or回归选取
关于模型选择时候我想用协同过滤 但是不知道关于特征的协同过滤是怎么执行的 是每个特征都有一个评分构成评价矩阵么?
- 2022-02-25 17:28:51下载
- 积分:1
-
SSTCA
半监督迁移SSTCA算法实现,matlab代码。包括拉普拉斯图矩阵(Semisupervised Domain Adaptation via Transfer Component Analysis)
- 2021-04-23 13:58:48下载
- 积分:1
-
频繁子图挖掘算法pafi1.0.1.zip
频繁子图挖掘算法pafi1.0.1.zip,频繁子图挖掘算法采用c++实现,图数据挖掘方向的可以看一看。
- 2022-01-21 02:32:05下载
- 积分:1
-
1595175
动画演示多种排序算法,包括冒泡排序,选择排序,插入排序,快速排序等,()
- 2018-03-13 23:48:48下载
- 积分:1
-
FNN与PCA和KPCA结合
一种特征提取方法:结合主元分析(PCA)和核主元分析(KPCA)的前馈神经网络(FNN)(A feature extraction method: the feedforward neural network (FNN) combined with principal component analysis (PCA) and kernel principal component analysis (KPCA))
- 2020-09-18 10:27:53下载
- 积分:1
-
MATLAB_SMOTE
SMOTE插值算法,补全数据的不平衡性。(SMOTE interpolation algorithm to complete the imbalance of data.)
- 2018-08-20 10:05:48下载
- 积分:1
-
2555333
牛顿插值法,选择插值节点文件,有点小麻烦()
- 2018-03-15 20:34:53下载
- 积分:1
-
KNN01
说明: 用来作分类识别的KNN算法,非常好用非常好用(A very useful nearest neighbor algorithm)
- 2020-08-03 19:28:41下载
- 积分:1
-
频繁项集挖掘算法--CFPGROWTH算法
数据挖掘经典算法,频繁项集挖掘经典算法,CFPGROWTH算法,JAVA实现,代码中有详细注释
- 2023-03-29 10:25:03下载
- 积分:1
-
IABC_KMC_test_on_Iris_wine_glass
基于人工蚁群的的改进Kmeans,进行了改进,效果较好(Based on the improvement of artificial ant colony, Kmeans have been improved and the effect is better)
- 2017-05-20 20:24:27下载
- 积分:1