-
豆瓣电影大数据分析-【附带爬虫豆瓣,对数据处理,数据分析,可视化】.zip
【实例简介】平台部分主要是hadoop分布式系统,基于该系统融合了组件Spark,Hbase,Hive,Sqoop,Mahout等。继而进行相关的数据分析
该项目主要分为以下几部分:
1:数据采集
主要是基于豆瓣电影的数据,进行分析,所以首先要爬取相关的电影数据,对应的源代码在DouBan_Spider目录下,主要是采用Python + BeautifulSoup + urllib进行数据采集
2:ETL预处理
3:数据分析
4:可视化
代码封装完好,
适用于对作影视感情分析,影评分析,电影类型分析,推荐系统的建立
- 2021-11-24 00:46:15下载
- 积分:1
-
复变函数与积分变换
该资源包含了复变函数与积分变换相关内容。共有四本书籍。《复变函数和积分变换》,《复变函数》,《工程数学:积分变换》(张元林,第四版),《积分变换以及应用》(英文版第三版)。有需要的同学请自行下载。
- 2021-05-07下载
- 积分:1
-
鸿蒙OS Hi3861 开发板套件_原理图硬件资料.zip
【实例简介】鸿蒙OS Hi3861 开发板套件_原理图硬件资料,智能家居套件(主板、底板、显示板、NFC板、红绿灯板、炫彩灯板、环境检测板、JTAG接口板),智能小车套件
- 2021-11-30 00:51:18下载
- 积分:1
-
弗洛伊德 算法matlab
弗洛伊德 算法matlab源程序,求任意两点之间的最短距离,很不错的算法!
- 2020-12-09下载
- 积分:1
-
基于javase的点餐平台(吃货)
一个java程序,适合与新手入门,gui程序,结合mysql数据库,类似美团,淘宝的点餐平台
- 2021-05-06下载
- 积分:1
-
Louvain快速社区发现算法(Fast unfolding算法)
目前社区发现算法中计算速度最快的算法,由Vincent D.Blondel等人在2008年提出,基于modularity optimization启发式算法,代码可直接使用,在Vincent D.Blondel个人官网上下载的
- 2020-11-28下载
- 积分:1
-
RTX下的PCI6208/PCI6216V的驱动
基于RTX2012的PCI6208/PCI6216V的驱动,可以实现对PCI6208的实时控制,广泛应用于PC-BASED的实时控制系统,低成本高可靠性的解决方案。
- 2020-12-11下载
- 积分:1
-
光伏发电系统的MATLAB仿真
基于MATLAB的光伏系统的仿真完美波形!
- 2020-12-06下载
- 积分:1
-
永磁同步电机无速度传感器DSP程序
基于DSP28335的永磁同步电机无速度传感器程序
- 2020-12-02下载
- 积分:1
-
项目启动会PPT模板
启动会PPT汇报模板,包括项目背景、建设内容、里程碑计划、沟通方式、项目组织、需求变更流程。
- 2020-12-07下载
- 积分:1