-
my_apriori
很好用的关联规则挖掘经典算法,推荐使用。包括支持度、置信度、提升度,输出结果到excel文件(Good use of association rules mining classic algorithm, recommended)
- 2018-11-14 15:51:16下载
- 积分:1
-
Spider_baiduvideo
利用urllib.request进行爬虫,
下载百度视频页面的所有图片保存到本地(Use urllib.request for crawl.
Download all the pictures from Baidu video page to local.)
- 2018-04-02 18:32:19下载
- 积分:1
-
arima
时间序列法,通过过去数据来建立相应模型来预测未来数据(Time series, using past data to establish corresponding models to predict future data)
- 2018-03-08 22:01:43下载
- 积分:1
-
Archive
PCA 数据降维 PTYTHON 数据分析/挖掘(PCA dimensionality reduction data mining/analysis)
- 2020-06-21 15:40:02下载
- 积分:1
-
spider-(2)
应用python编写的百度指数新闻爬取代码(baiduindex spider)
- 2017-03-15 21:45:43下载
- 积分:1
-
pu_ju_lei
将数据集转换为拉普拉斯矩阵,然后利用基于图论的谱聚类进行聚类。拉普拉斯矩阵采用高斯核函数,全连接方法计算。谱聚类擅长处理高维数据或非凸数据集。(The data set is transformed into Laplacian matrix, and then clustered by spectral clustering based on graph theory. The Laplacian matrix is calculated by using the Gauss kernel function and the full connection method. Spectral clustering is good at dealing with high-dimensional or non-convex data sets.)
- 2019-07-01 16:05:39下载
- 积分:1
-
OPTICS
此为利用optics聚类方法剔除风电异常数据后,采用极限学习机验证的代码(optics data mining)
- 2017-03-22 19:29:22下载
- 积分:1
-
python 实现随机森林
应用背景
数据 :两个月之内 40000个客户的15个数据字段 包含客户的 地 理位置,职业,职级,年收入,。。。。。。 购买过得产品
目的:对新客户进行推荐一个适合该客户的产品, 对老客户推荐可能再购买的产品
数据处理
数据清洗: describe 每个特征统计分析 方差 -分析缺陷特征和波动性
空值赋值为 “-1 “ - 保证模型的可使用
数据归一化:eg:邮编 相似度不高 根据一线二线….进行划分 – 特征的重要性
关键技术特征选择
随机森林: 判断特征的重要性 :思考为何重要性高
AHP : 迭代设置每个特征的权重
模型选择 :根据数据量数量,是否有标签,分类or回归选取
关于模型选择时候我想用协同过滤 但是不知道关于特征的协同过滤是怎么执行的 是每个特征都有一个评分构成评价矩阵么?
- 2022-02-25 17:28:51下载
- 积分:1
-
Python数据预处理
说明: Python数据预处理示例,包括数据清洗、数据整合、数据变换等操作。(Python data preprocessing examples, including data cleaning, data integration, data transformation and other operations.)
- 2020-09-17 14:07:54下载
- 积分:1
-
rcitime__type
二进制粒子群优化算法pso,主程序:swarmpso m 它包括以下子程序: 1 初始化:swarminit m 2 适应值计算函()
- 2017-12-09 12:19:17下载
- 积分:1