-
python 实现随机森林
应用背景
数据 :两个月之内 40000个客户的15个数据字段 包含客户的 地 理位置,职业,职级,年收入,。。。。。。 购买过得产品
目的:对新客户进行推荐一个适合该客户的产品, 对老客户推荐可能再购买的产品
数据处理
数据清洗: describe 每个特征统计分析 方差 -分析缺陷特征和波动性
空值赋值为 “-1 “ - 保证模型的可使用
数据归一化:eg:邮编 相似度不高 根据一线二线….进行划分 – 特征的重要性
关键技术特征选择
随机森林: 判断特征的重要性 :思考为何重要性高
AHP : 迭代设置每个特征的权重
模型选择 :根据数据量数量,是否有标签,分类or回归选取
关于模型选择时候我想用协同过滤 但是不知道关于特征的协同过滤是怎么执行的 是每个特征都有一个评分构成评价矩阵么?
- 2022-02-25 17:28:51下载
- 积分:1
-
KNN01
说明: 用来作分类识别的KNN算法,非常好用非常好用(A very useful nearest neighbor algorithm)
- 2020-08-03 19:28:41下载
- 积分:1
-
havz-bhlding
BP网络VC代码 其实这就是成型的算法,估计好多人写过(BP network VC code is actually a molding algorithm, estimated that a lot of people have written)
- 2018-09-06 15:00:59下载
- 积分:1
-
Classifiers___Bagging+Knn
该程序用于分类,用到的算法是Bagging and Knn 两种算法(This program is used for classification, the algorithm used is bagging and knn two algorithms)
- 2020-07-02 05:40:02下载
- 积分:1
-
edge
工程算法 这是一个很有用的工程数值算法集锦(Engineering algorithm this is a useful collection of engineering numerical algorithms.)
- 2018-09-05 06:04:58下载
- 积分:1
-
mlno
一个833分酒问题的求解,C++编写,简单易读,输出最佳路径解,()
- 2018-02-04 15:22:16下载
- 积分:1
-
最近邻分类代码
在linux 下C语言实现最近邻聚类算法,工程已经使用(near K neighbor cluster)
- 2017-12-21 16:45:51下载
- 积分:1
-
Archive
说明: PCA 数据降维 PTYTHON 数据分析/挖掘(PCA dimensionality reduction data mining/analysis)
- 2020-06-21 15:40:02下载
- 积分:1
-
knn.py
kNN算法的核心思想是如果一个样本在特征空间中的k个最相邻的样本中的大多数属于某一个类别,则该样本也属于这个类别,并具有这个类别上样本的特性。该方法在确定分类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。 kNN方法在类别决策时,只与极少量的相邻样本有关。由于kNN方法主要靠周围有限的邻近的样本,而不是靠判别类域的方法来确定所属类别的,因此对于类域的交叉或重叠较多的待分样本集来说,kNN方法较其他方法更为适合。(Basic source application)
- 2018-10-30 16:50:13下载
- 积分:1
-
雷达matlab仿真,波束形成,角度测量,跟踪等等
波形设计算法,阵列信号处理等相关知识的介绍仿真等(Introduction and Simulation of waveform design algorithm, array signal processing and other related knowledge)
- 2021-02-19 15:09:44下载
- 积分:1