-
高效用项集挖掘算法--HMINE算法
数据挖掘算法,高效用项集挖掘算法,加权频发项集挖掘算法,HMINE算法,源码中有详细注释
- 2022-02-04 07:22:38下载
- 积分:1
-
决策树与集成算法
决策树与集成算法,用来分类已知数据种类,希望对编程有帮助(Decision tree and ensemble algorithm are used to classify known data types.)
- 2018-09-09 17:38:01下载
- 积分:1
-
AP聚类
说明: 实现了无监督AP聚类 其优势在于不用知道聚类个数(The advantage of unsupervised AP clustering is that the number of clusters is not known)
- 2020-08-13 18:05:48下载
- 积分:1
-
sklearn-tree-BN-knn
说明: 分类器的性能比较与调优:
使用scikit-learn 包中的tree,贝叶斯,knn,对数据进行模型训练,尽量了解其原理及运用。
使用不同分析三种分类器在实验中的性能比较,分析它们的特点。
本实验采用的数据集为house与segment。(Performance comparison and optimization of classifiers:
We use tree, Bayesian and KNN in scikit-learnpackage to train the data model and try to understand its principle and application.
The performances of three classifiers are compared and their characteristics are analyzed.
The data set used in this experiment is house and segment.)
- 2021-04-16 15:08:53下载
- 积分:1
-
chks光滑支持向量机-程序
CHKS光滑孪生支持向量机程序, 采用CHKS光滑函数逼近无约束孪生支持向量机的不可微部分,得到一类光滑的孪生支持向量机。(CHKS smooth twin support vector machine program)
- 2020-12-25 09:09:04下载
- 积分:1
-
Classifiers___Bagging+Knn
该程序用于分类,用到的算法是Bagging and Knn 两种算法(This program is used for classification, the algorithm used is bagging and knn two algorithms)
- 2020-07-02 05:40:02下载
- 积分:1
-
python 实现随机森林
应用背景
数据 :两个月之内 40000个客户的15个数据字段 包含客户的 地 理位置,职业,职级,年收入,。。。。。。 购买过得产品
目的:对新客户进行推荐一个适合该客户的产品, 对老客户推荐可能再购买的产品
数据处理
数据清洗: describe 每个特征统计分析 方差 -分析缺陷特征和波动性
空值赋值为 “-1 “ - 保证模型的可使用
数据归一化:eg:邮编 相似度不高 根据一线二线….进行划分 – 特征的重要性
关键技术特征选择
随机森林: 判断特征的重要性 :思考为何重要性高
AHP : 迭代设置每个特征的权重
模型选择 :根据数据量数量,是否有标签,分类or回归选取
关于模型选择时候我想用协同过滤 但是不知道关于特征的协同过滤是怎么执行的 是每个特征都有一个评分构成评价矩阵么?
- 2022-02-25 17:28:51下载
- 积分:1
-
qb神经网络
从数据库获取车辆在一段时间内的所有行驶记录的相关数据,确定所需数据为GPS经纬度坐标和驾驶时长等,QB模型采用MDF的思想,其基本思想为:通过平均直接翻转距离函数定义两条轨迹之间的距离,两条轨迹需要具有相同的经纬度点数,具有相同点数的轨迹最大的优点是对轨迹距离成对计算,且相同轨迹之间具有更高的分辨率,对于轨迹聚类的结果有一定的优化。(Retrieved from the database cars all over a period of time, record the related data, determine the required data for the GPS latitude and longitude coordinates, and the driving time, QB model by adopting the idea of MDF, its basic idea is: flip directly by the average distance function definition of the distance between two trajectories, two tracks will have the same latitude and longitude points, and has the biggest advantages of the same points of trajectory track distance calculation in pairs, and has higher resolution, between the same trajectory for trajectory clustering results have certain optimization.)
- 2020-06-23 08:00:01下载
- 积分:1
-
datasnooping
机器学习 数据挖掘 数值算法 人工智能 全英文教材(python machine learning data snooping)
- 2018-09-20 20:51:47下载
- 积分:1
-
用python 做的网络数据爬虫
说明: 用python 做的网络数据爬虫,爬取淘宝数据,并分析。(Use Python to do the network data crawler, crawl the Taobao data, and analyze.)
- 2020-02-25 18:34:31下载
- 积分:1