-
Spider_baiduvideo
利用urllib.request进行爬虫,
下载百度视频页面的所有图片保存到本地(Use urllib.request for crawl.
Download all the pictures from Baidu video page to local.)
- 2018-04-02 18:32:19下载
- 积分:1
-
用python 做的网络数据爬虫
说明: 用python 做的网络数据爬虫,爬取淘宝数据,并分析。(Use Python to do the network data crawler, crawl the Taobao data, and analyze.)
- 2020-02-25 18:34:31下载
- 积分:1
-
python 实现随机森林
应用背景
数据 :两个月之内 40000个客户的15个数据字段 包含客户的 地 理位置,职业,职级,年收入,。。。。。。 购买过得产品
目的:对新客户进行推荐一个适合该客户的产品, 对老客户推荐可能再购买的产品
数据处理
数据清洗: describe 每个特征统计分析 方差 -分析缺陷特征和波动性
空值赋值为 “-1 “ - 保证模型的可使用
数据归一化:eg:邮编 相似度不高 根据一线二线….进行划分 – 特征的重要性
关键技术特征选择
随机森林: 判断特征的重要性 :思考为何重要性高
AHP : 迭代设置每个特征的权重
模型选择 :根据数据量数量,是否有标签,分类or回归选取
关于模型选择时候我想用协同过滤 但是不知道关于特征的协同过滤是怎么执行的 是每个特征都有一个评分构成评价矩阵么?
- 2022-02-25 17:28:51下载
- 积分:1
-
EM 算法
用EM算法求解高斯混合模型并可视化,数据是男女生的身高分布,前提是初始化男女生身高各自的均值和方差和比例,然后由EM算法求解,男女生身高的均值方差,以拟合数据。(The EM algorithm is used to solve the Gauss mixture model and visualize. The data is the height distribution of male and female. The premise is to initialize the mean, variance and proportion of the male and female height, then the mean variance of the height of male and female is solved by the EM algorithm, so as to fit the data.)
- 2018-07-14 12:46:57下载
- 积分:1
-
聚类指标小结
聚类评价指标的各种说明,非常详细,请仔细阅读。(Cluster evaluation indicators of various descriptions, very detailed.)
- 2020-06-19 05:20:01下载
- 积分:1
-
数据挖掘中编写C语言程序数据预处理,读取文本文件中的数据,使用链表,并输出该组数据的按平均值、中值、边界值平滑的结果。若分箱时数据缺失则用最后的值复制代替,还要找出程序中
数据挖掘中编写C语言程序数据预处理,读取文本文件中的数据,使用链表,并输出该组数据的按平均值、中值、边界值平滑的结果。若分箱时数据缺失则用最后的值复制代替,还要找出程序中的离群点,要求程序符合结构化程序设计风格,关键地方需加注释。完美实现!
- 2022-02-28 20:00:10下载
- 积分:1
-
k-means java实现 Iris四大数据集
通过优化的k-means算法 采用了密度和优化评测函数实现了对Iris等数据集的聚类。
- 2022-03-18 06:28:52下载
- 积分:1
-
piactical__algorithm
一个很实用的采用Neville算法的拉格朗日插值程序,(A very practical Lagrange interpolation program using Neville algorithm,)
- 2018-09-03 22:04:52下载
- 积分:1
-
数据挖掘决策树Java源代码
资源描述决策树是建立在信息论基础之上,对数据进行分类挖掘的一种方法。其思想是,通过一批已知的训练数据建立一棵决策树,然后利用建好的决策树,对数据进行预测。决策树的建立过程可以看成是数据规则的生成过程。由于基于决策树的分类方法结构简单,本身就是人们能够理解的规则。其次,决策树方法计算复杂度不大,分类效率高,能够处理大数据量的训练集;最后,决策树方法的分类精度较高,对噪声数据有较好的健壮性,符合一般系统的要求。
- 2022-03-12 14:04:11下载
- 积分:1
-
Adaboost
Python实现Adaboost算法,数据集为horseColic马疝气病数据集,准确率和sklearn库中的adaboost算法一样。(Python implementation adaboost algorithm, the data set is horseColic horse hernia disease data collection, accuracy and sklearn library adaboost the same algorithm.)
- 2017-04-21 15:00:34下载
- 积分:1