-
boxcox
boxcox函数的python实现,引用该函数可将偏态分布调整为正态分布(Python implementation of box Cox function)
- 2020-06-17 09:40:01下载
- 积分:1
-
HMM-homework
说明: 隐马尔科夫实现,包含forward-hmm, Viterbi-hmm, Baum-Welch-hmm(Hidden Markov implementation, including forward-hmm, Viterbi-hmm, Baum-Welch-hmm)
- 2019-04-26 17:02:43下载
- 积分:1
-
boston_housing
说明: 采用机器学习预测房价.使用波士顿房屋信息数据来训练和测试一个模型,并对模型的性能和预测能力进行评估。(Using Machine Learning to Predict House Prices)
- 2019-10-04 11:48:44下载
- 积分:1
-
89245721
说明:
- 2017-12-09 07:59:44下载
- 积分:1
-
Java实现Apriori数据挖掘算法
Java实现Apriori数据挖掘算法,包内还有实例用的数据库
Apriori数据挖掘算法:先找出所有的频集,这些项集出现的频繁性至少和预定义的最小支持度一样。然后由频集产生强关联规则,这些规则必须满足最小支持度和最小可信度。然后使用第1步找到的频集产生期望的规则,产生只包含集合的项的所有规则,其中每一条规则的右部只有一项,这里采用的是中规则的定义。一旦这些规则被生成,那么只有那些大于用户给定的最小可信度的规则才被留下来。为了生成所有频集,使用了递归的方法。
请在jbuilder下编译 配好JDBC驱动
商品如果
买的表示为大写
没买表示为小写的
具体看GetSource.java
- 2022-10-02 14:05:03下载
- 积分:1
-
QB模型 神经网络
说明: 从数据库获取车辆在一段时间内的所有行驶记录的相关数据,确定所需数据为GPS经纬度坐标和驾驶时长等,QB模型采用MDF的思想,其基本思想为:通过平均直接翻转距离函数定义两条轨迹之间的距离,两条轨迹需要具有相同的经纬度点数,具有相同点数的轨迹最大的优点是对轨迹距离成对计算,且相同轨迹之间具有更高的分辨率,对于轨迹聚类的结果有一定的优化。(Retrieved from the database cars all over a period of time, record the related data, determine the required data for the GPS latitude and longitude coordinates, and the driving time, QB model by adopting the idea of MDF, its basic idea is: flip directly by the average distance function definition of the distance between two trajectories, two tracks will have the same latitude and longitude points, and has the biggest advantages of the same points of trajectory track distance calculation in pairs, and has higher resolution, between the same trajectory for trajectory clustering results have certain optimization.)
- 2020-06-23 08:00:01下载
- 积分:1
-
sklearn-tree-BN-knn
分类器的性能比较与调优:
使用scikit-learn 包中的tree,贝叶斯,knn,对数据进行模型训练,尽量了解其原理及运用。
使用不同分析三种分类器在实验中的性能比较,分析它们的特点。
本实验采用的数据集为house与segment。(Performance comparison and optimization of classifiers:
We use tree, Bayesian and KNN in scikit-learnpackage to train the data model and try to understand its principle and application.
The performances of three classifiers are compared and their characteristics are analyzed.
The data set used in this experiment is house and segment.)
- 2021-04-16 15:08:53下载
- 积分:1
-
python 实现随机森林
应用背景
数据 :两个月之内 40000个客户的15个数据字段 包含客户的 地 理位置,职业,职级,年收入,。。。。。。 购买过得产品
目的:对新客户进行推荐一个适合该客户的产品, 对老客户推荐可能再购买的产品
数据处理
数据清洗: describe 每个特征统计分析 方差 -分析缺陷特征和波动性
空值赋值为 “-1 “ - 保证模型的可使用
数据归一化:eg:邮编 相似度不高 根据一线二线….进行划分 – 特征的重要性
关键技术特征选择
随机森林: 判断特征的重要性 :思考为何重要性高
AHP : 迭代设置每个特征的权重
模型选择 :根据数据量数量,是否有标签,分类or回归选取
关于模型选择时候我想用协同过滤 但是不知道关于特征的协同过滤是怎么执行的 是每个特征都有一个评分构成评价矩阵么?
- 2022-02-25 17:28:51下载
- 积分:1
-
svm
运用支持向量机对一组超宽带非视距信号识别(Support Vector Machine Signal Identification)
- 2017-03-15 09:54:33下载
- 积分:1
-
Apriori-master
用Apriori算法挖掘出入侵检测数据集KDD99的数据关联性,从而检测出未知的攻击(Apriori algorithm is used to extract the data association of the intrusion detection data set KDD99, and the unknown attack is detected)
- 2021-04-21 21:58:49下载
- 积分:1