-
Hands-on programming with R
说明: 本书精心策划了三个虚拟项目,将数据科学家必需的专业技能融合其中,教会读者如何将数据存储到计算机内存中,如何在必要的时候转换内存中的数据值,如何用R编写自己的程序并将其用于数据分析和模拟运行。读者将跟随世界一流的RStudio培训师掌握宝贵的编程技能,并借助这些技能成为优秀的数据科学家。(Introduction to R Language)
- 2019-05-30 15:04:30下载
- 积分:1
-
PCA
一个用python实现的PCA算法,并且给了简易素材(A PCA algorithm implemented in python, and gave a simple material)
- 2020-08-23 14:38:17下载
- 积分:1
-
Python for Data Analysis
说明: 利用python进行数据分析,英文书籍,从pandas库的数据分析工具开始利用高性能工具对数据进行加载、清理、转换、合并以及重塑;利用matpIotlib创建散点图以及静态或交互式的可视化结果;利用pandas的groupby功能对数据集进行切片、切块和汇总操作;处理各种各样的时间序列数据。(Starting from the data analysis tools of pandas database, high performance tools are used to load, clean, transform, merge and remodel data; scatter plots and static or interactive visualization results are created by matpIotlib; data sets are sliced, sliced and aggregated by pandas group by function; and various operations are processed. Time series data.)
- 2020-06-16 03:20:01下载
- 积分:1
-
PCA
说明: 一个用python实现的PCA算法,并且给了简易素材(A PCA algorithm implemented in python, and gave a simple material)
- 2020-08-23 14:38:17下载
- 积分:1
-
python 实现随机森林
应用背景
数据 :两个月之内 40000个客户的15个数据字段 包含客户的 地 理位置,职业,职级,年收入,。。。。。。 购买过得产品
目的:对新客户进行推荐一个适合该客户的产品, 对老客户推荐可能再购买的产品
数据处理
数据清洗: describe 每个特征统计分析 方差 -分析缺陷特征和波动性
空值赋值为 “-1 “ - 保证模型的可使用
数据归一化:eg:邮编 相似度不高 根据一线二线….进行划分 – 特征的重要性
关键技术特征选择
随机森林: 判断特征的重要性 :思考为何重要性高
AHP : 迭代设置每个特征的权重
模型选择 :根据数据量数量,是否有标签,分类or回归选取
关于模型选择时候我想用协同过滤 但是不知道关于特征的协同过滤是怎么执行的 是每个特征都有一个评分构成评价矩阵么?
- 2022-02-25 17:28:51下载
- 积分:1
-
ELM
一种神经网络算法:极限学习机(ELM),包括分类和回归,仿真验证无误,适合初学者练习(A data mining algorithm: limit learning machine (ELM), including classification and regression, simulation verification is unmistakable, suitable for beginners to practice)
- 2018-03-14 12:45:55下载
- 积分:1
-
粗糙集
粗糙集在进行属性约简时需要求其正域,此为求正域程序(Rough Set for Positive Domain)
- 2020-06-19 09:00:06下载
- 积分:1
-
LOF
基于密度的局部离群点检测,使用于当全部样本点的密度不一致的情况(Local outlier detection based on density)
- 2021-04-14 16:28:55下载
- 积分:1
-
my_apriori
很好用的关联规则挖掘经典算法,推荐使用。包括支持度、置信度、提升度,输出结果到excel文件(Good use of association rules mining classic algorithm, recommended)
- 2018-11-14 15:51:16下载
- 积分:1
-
mxzr
判断链表中是否有循环 有的话,按序打印一次(To determine if there is a loop in the list, print it in sequence)
- 2018-09-04 05:19:13下载
- 积分:1