-
用python 做的网络数据爬虫
说明: 用python 做的网络数据爬虫,爬取淘宝数据,并分析。(Use Python to do the network data crawler, crawl the Taobao data, and analyze.)
- 2020-02-25 18:34:31下载
- 积分:1
-
python 实现随机森林
应用背景
数据 :两个月之内 40000个客户的15个数据字段 包含客户的 地 理位置,职业,职级,年收入,。。。。。。 购买过得产品
目的:对新客户进行推荐一个适合该客户的产品, 对老客户推荐可能再购买的产品
数据处理
数据清洗: describe 每个特征统计分析 方差 -分析缺陷特征和波动性
空值赋值为 “-1 “ - 保证模型的可使用
数据归一化:eg:邮编 相似度不高 根据一线二线….进行划分 – 特征的重要性
关键技术特征选择
随机森林: 判断特征的重要性 :思考为何重要性高
AHP : 迭代设置每个特征的权重
模型选择 :根据数据量数量,是否有标签,分类or回归选取
关于模型选择时候我想用协同过滤 但是不知道关于特征的协同过滤是怎么执行的 是每个特征都有一个评分构成评价矩阵么?
- 2022-02-25 17:28:51下载
- 积分:1
-
apcluster.m
ap算法完成ap聚类操作 需要输入参数为数据集 偏向参数 输出结果为聚类数目(The AP algorithm completes the AP clustering operation, the input parameter is the data set bias parameter, and the output result is the number of clusters)
- 2017-11-19 23:56:45下载
- 积分:1
-
ELM
一种神经网络算法:极限学习机(ELM),包括分类和回归,仿真验证无误,适合初学者练习(A data mining algorithm: limit learning machine (ELM), including classification and regression, simulation verification is unmistakable, suitable for beginners to practice)
- 2018-03-14 12:45:55下载
- 积分:1
-
89245721
说明:
- 2017-12-09 07:59:44下载
- 积分:1
-
8641704
插值抽取的内容,数字变频用, 分享了,请高手完善指教,()
- 2018-05-25 06:35:56下载
- 积分:1
-
FNN与PCA和KPCA结合
一种特征提取方法:结合主元分析(PCA)和核主元分析(KPCA)的前馈神经网络(FNN)(A feature extraction method: the feedforward neural network (FNN) combined with principal component analysis (PCA) and kernel principal component analysis (KPCA))
- 2020-09-18 10:27:53下载
- 积分:1
-
Apriori-master
用Apriori算法挖掘出入侵检测数据集KDD99的数据关联性,从而检测出未知的攻击(Apriori algorithm is used to extract the data association of the intrusion detection data set KDD99, and the unknown attack is detected)
- 2021-04-21 21:58:49下载
- 积分:1
-
MATLAB_SMOTE
SMOTE插值算法,补全数据的不平衡性。(SMOTE interpolation algorithm to complete the imbalance of data.)
- 2018-08-20 10:05:48下载
- 积分:1
-
1595175
动画演示多种排序算法,包括冒泡排序,选择排序,插入排序,快速排序等,()
- 2018-03-13 23:48:48下载
- 积分:1