-
Ecalt算法
Eclat算法是一种深度优先算法,采用垂直数据表示形式,在概念格理论的基础上利用基于前缀的等价关系将搜索空间(概念格)划分为较小的子空间(子概念格)。Eclat算法采用方法二计算支持度。对候选k项集进行支持度计算时,不需再次扫描数据库,仅在一次扫描数据库后得到每个1项集的支持度,而候选k项集的支持度就是在对k-1项集进行交集操作后得到的该k项集Tidset中元素的个数。本算法利用diffset数据格式实现。
- 2022-03-02 17:06:13下载
- 积分:1
-
高效用项集挖掘算法--HMINE算法
数据挖掘算法,高效用项集挖掘算法,加权频发项集挖掘算法,HMINE算法,源码中有详细注释
- 2022-02-04 07:22:38下载
- 积分:1
-
朴素贝叶斯分类
朴素贝叶斯分类的分类器实现,使用的是matlab语言。内含测试集和训练集,可直接运行,readme.txt文件中说明了数据格式
- 2022-02-07 02:48:39下载
- 积分:1
-
频繁项集挖掘算法--CFPGROWTH算法
数据挖掘经典算法,频繁项集挖掘经典算法,CFPGROWTH算法,JAVA实现,代码中有详细注释
- 2023-03-29 10:25:03下载
- 积分:1
-
微博数据挖掘
利用python调用新浪api接口实现的新浪微博数据的挖掘,能够获取指定的经纬度地点的微博动态信息,还能够将其写入MySQL数据库中。
- 2022-07-12 15:52:46下载
- 积分:1
-
频繁项集挖掘算法
频繁项集挖掘算法,能在大量局部特征中发现频繁空间配置,这些空间配置可以作为词语,加入到特征包中进行分类,实现图像分类。
- 2022-03-23 21:38:47下载
- 积分:1
-
带阻尼参数的pagerank实现
资源描述实现基本的pagerank算法,可实现传递阻尼参数和迭代次数。源文件从文件中读取
- 2022-09-10 21:45:04下载
- 积分:1
-
python 实现随机森林
应用背景
数据 :两个月之内 40000个客户的15个数据字段 包含客户的 地 理位置,职业,职级,年收入,。。。。。。 购买过得产品
目的:对新客户进行推荐一个适合该客户的产品, 对老客户推荐可能再购买的产品
数据处理
数据清洗: describe 每个特征统计分析 方差 -分析缺陷特征和波动性
空值赋值为 “-1 “ - 保证模型的可使用
数据归一化:eg:邮编 相似度不高 根据一线二线….进行划分 – 特征的重要性
关键技术特征选择
随机森林: 判断特征的重要性 :思考为何重要性高
AHP : 迭代设置每个特征的权重
模型选择 :根据数据量数量,是否有标签,分类or回归选取
关于模型选择时候我想用协同过滤 但是不知道关于特征的协同过滤是怎么执行的 是每个特征都有一个评分构成评价矩阵么?
- 2022-02-25 17:28:51下载
- 积分:1
-
关于大数据的相关论文
关于大数据的论文,对稀疏表示分类有很大的帮助,希望对初学者哟帮助
- 2022-02-06 00:21:30下载
- 积分:1
-
weka源代码
weka是一个很优秀的数据挖掘软件,可以把weka作为程序包打入工程中,基本想要的功能很快就能实现
- 2023-06-01 10:00:04下载
- 积分:1