-
python 实现随机森林
应用背景
数据 :两个月之内 40000个客户的15个数据字段 包含客户的 地 理位置,职业,职级,年收入,。。。。。。 购买过得产品
目的:对新客户进行推荐一个适合该客户的产品, 对老客户推荐可能再购买的产品
数据处理
数据清洗: describe 每个特征统计分析 方差 -分析缺陷特征和波动性
空值赋值为 “-1 “ - 保证模型的可使用
数据归一化:eg:邮编 相似度不高 根据一线二线….进行划分 – 特征的重要性
关键技术特征选择
随机森林: 判断特征的重要性 :思考为何重要性高
AHP : 迭代设置每个特征的权重
模型选择 :根据数据量数量,是否有标签,分类or回归选取
关于模型选择时候我想用协同过滤 但是不知道关于特征的协同过滤是怎么执行的 是每个特征都有一个评分构成评价矩阵么?
- 2022-02-25 17:28:51下载
- 积分:1
-
EM 算法
用EM算法求解高斯混合模型并可视化,数据是男女生的身高分布,前提是初始化男女生身高各自的均值和方差和比例,然后由EM算法求解,男女生身高的均值方差,以拟合数据。(The EM algorithm is used to solve the Gauss mixture model and visualize. The data is the height distribution of male and female. The premise is to initialize the mean, variance and proportion of the male and female height, then the mean variance of the height of male and female is solved by the EM algorithm, so as to fit the data.)
- 2018-07-14 12:46:57下载
- 积分:1
-
Java实现Apriori数据挖掘算法
Java实现Apriori数据挖掘算法,包内还有实例用的数据库
Apriori数据挖掘算法:先找出所有的频集,这些项集出现的频繁性至少和预定义的最小支持度一样。然后由频集产生强关联规则,这些规则必须满足最小支持度和最小可信度。然后使用第1步找到的频集产生期望的规则,产生只包含集合的项的所有规则,其中每一条规则的右部只有一项,这里采用的是中规则的定义。一旦这些规则被生成,那么只有那些大于用户给定的最小可信度的规则才被留下来。为了生成所有频集,使用了递归的方法。
请在jbuilder下编译 配好JDBC驱动
商品如果
买的表示为大写
没买表示为小写的
具体看GetSource.java
- 2022-10-02 14:05:03下载
- 积分:1
-
高效用项集挖掘算法--HMINE算法
数据挖掘算法,高效用项集挖掘算法,加权频发项集挖掘算法,HMINE算法,源码中有详细注释
- 2022-02-04 07:22:38下载
- 积分:1
-
用matlab 实现了kmeans算法
用matlab 实现了kmeans算法还附有评价指标计算(Matlab to achieve kmeans algorithm also attached to the evaluation index calculation)
- 2020-06-19 04:40:01下载
- 积分:1
-
KKDZSXX
扩展卡尔曼滤波与无迹卡尔曼滤波的跟踪滤波性能的比较()
- 2020-10-08 14:57:36下载
- 积分:1
-
数据挖掘技术在公安犯罪行为分析中的应用研究
数据挖掘在经侦项目中的应用,本文用到python中的社区划分算法(In the application of data mining in economic investigation projects, this paper uses community partition algorithm in Python.)
- 2020-07-03 08:00:02下载
- 积分:1
-
DBSCAN
Clustering the data with Density-Based Scan Algorithm with Noise (DBSCAN)
- 2017-05-02 22:36:20下载
- 积分:1
-
Eigenfunction-Program-Program
强大的计算电磁场本征函数与本征模的程序,matlab版本(A powerful Program for calculating the Eigenfunction and Eigenmode of electromagnetic Field)
- 2018-09-11 22:56:16下载
- 积分:1
-
project
数据挖掘,推荐系统,堆叠降噪自编码器,逻辑回归(Data mining, recommender systems, stack noise reduction, self coder, logic regression)
- 2021-01-25 23:58:43下载
- 积分:1