-
Python数据预处理
说明: Python数据预处理示例,包括数据清洗、数据整合、数据变换等操作。(Python data preprocessing examples, including data cleaning, data integration, data transformation and other operations.)
- 2020-09-17 14:07:54下载
- 积分:1
-
House_price
主要是对二手房房价的因变量房价和其相关的因变量之间的关系进行简单的描述统计分析(Mainly for the second-hand house price dependent variable housing prices and its related variables of the relationship between the simple description of statistical analysis)
- 2017-11-10 15:40:51下载
- 积分:1
-
频繁项集挖掘算法--FPGROWTH算法
数据挖掘经典算法,频繁项集挖掘经典算法,FPGROWTH算法,源码中有详细说明
- 2023-06-08 16:30:03下载
- 积分:1
-
WDMAP6
bp网络实现认知无线电的检测和预测,从而达到了对频谱的分配(Bp network realizes the detection and prediction of cognitive radio, thus achieving the spectrum allocation.)
- 2018-09-06 15:06:37下载
- 积分:1
-
Spider_baiduvideo
利用urllib.request进行爬虫,
下载百度视频页面的所有图片保存到本地(Use urllib.request for crawl.
Download all the pictures from Baidu video page to local.)
- 2018-04-02 18:32:19下载
- 积分:1
-
数据挖掘决策树Java源代码
资源描述决策树是建立在信息论基础之上,对数据进行分类挖掘的一种方法。其思想是,通过一批已知的训练数据建立一棵决策树,然后利用建好的决策树,对数据进行预测。决策树的建立过程可以看成是数据规则的生成过程。由于基于决策树的分类方法结构简单,本身就是人们能够理解的规则。其次,决策树方法计算复杂度不大,分类效率高,能够处理大数据量的训练集;最后,决策树方法的分类精度较高,对噪声数据有较好的健壮性,符合一般系统的要求。
- 2022-03-12 14:04:11下载
- 积分:1
-
QB模型 神经网络
说明: 从数据库获取车辆在一段时间内的所有行驶记录的相关数据,确定所需数据为GPS经纬度坐标和驾驶时长等,QB模型采用MDF的思想,其基本思想为:通过平均直接翻转距离函数定义两条轨迹之间的距离,两条轨迹需要具有相同的经纬度点数,具有相同点数的轨迹最大的优点是对轨迹距离成对计算,且相同轨迹之间具有更高的分辨率,对于轨迹聚类的结果有一定的优化。(Retrieved from the database cars all over a period of time, record the related data, determine the required data for the GPS latitude and longitude coordinates, and the driving time, QB model by adopting the idea of MDF, its basic idea is: flip directly by the average distance function definition of the distance between two trajectories, two tracks will have the same latitude and longitude points, and has the biggest advantages of the same points of trajectory track distance calculation in pairs, and has higher resolution, between the same trajectory for trajectory clustering results have certain optimization.)
- 2020-06-23 08:00:01下载
- 积分:1
-
文本分类(采用Java语言)
资源描述利用分类算法实现对文本的数据挖掘,主要包括: 1. 语料库的构建,主要包括利用爬虫收集Web文档等; 2. 语料库的数据预处理,包括文档建模,如去噪,分词,建立数据字典, 使用词袋模型或主题模型表达文档等; 注:使用主题模型,如LDA可以获得实验加分; 3. 选择分类算法(如朴素贝叶斯、SVM等),训练文本分类器,理解所选 的分类算法的建模原理、实现过程和相关参数的含义; 4. 对测试集的文本进行分类 5. 对测试集的分类结果利用正确率和召回率进行分析评价。
- 2022-02-13 04:15:07下载
- 积分:1
-
妹子图
通过Python对妹子图网站的图片集进行爬取(Crawling the collection of images on the sister map site via Python)
- 2018-11-15 16:13:39下载
- 积分:1
-
KMeans
说明: 用matlab 实现了kmeans算法还附有评价指标计算(Matlab to achieve kmeans algorithm also attached to the evaluation index calculation)
- 2020-06-19 04:40:01下载
- 积分:1