登录
首页 » Others » 豆瓣电影大数据分析-【附带爬虫豆瓣,对数据处理,数据分析,可视化】.zip

豆瓣电影大数据分析-【附带爬虫豆瓣,对数据处理,数据分析,可视化】.zip

于 2021-11-24 发布
0 437
下载积分: 1 下载次数: 4

代码说明:

平台部分主要是hadoop分布式系统,基于该系统融合了组件Spark,Hbase,Hive,Sqoop,Mahout等。继而进行相关的数据分析 该项目主要分为以下几部分: 1:数据采集 主要是基于豆瓣电影的数据,进行分析,所以首先要爬取相关的电影数据,对应的源代码在DouBan_Spider目录下,主要是采用Python + BeautifulSoup + urllib进行数据采集 2:ETL预处理 3:数据分析 4:可视化 代码封装完好, 适用于对作影视感情分析,影评分析,电影类型分析,推荐系统的建立

下载说明:请别用迅雷下载,失败请重下,重下不扣分!

发表评论

0 个回复

  • RCNN(fast-RCNN)和faster-RCNN最全文献和matlab代码
    包含了RCNN、fast-rcnn以及faster-rcnn的相关文献、资料以及matlab代码(包含说明),绝对好东西.运行程序详细看代码说明。
    2020-11-27下载
    积分:1
  • 基于MATLAB的硬币计数设计.doc
    随着计算机技术和数字图像技术的快速发展,图像计数方法已经成为当今计数方法的一种重要手段,其目的就是从图像中准确获得某种物体的外观轮廓信息,进一步测量物体的特征参数并加以分析,以便于我们对物体进行轮廓分离、膨胀、填充和统计。本次设计紧密结合图像的分割和统计方法,主要探讨了硬币图像统计技术及其实现方法,设计了一套对硬币图像进行处理和分析的软件系统。本设计按照对硬币图像处理的先后步骤进行论述,通过论述算法原理和给出处理实例相结合来探讨各种方法的可行性,经过不断修改和尝试,最终实现了对硬币的计数。
    2020-12-10下载
    积分:1
  • matlab实现小波变换融合以及信息熵、平均梯度和RSEM的计算
    matlab实现小波变换融合以及信息熵、平均梯度和RSEM的计算
    2020-12-11下载
    积分:1
  • 软件工实验/实验室设备管理系统
    实验室管理系统每学年要对实验室设备使用情况进行统计、更新,其中:技术要求及限定条件(1) 每件设备在作入库登记时均由系统按类别自动顺序编号,形成设备号;设备报废时要及时修改相应的设备记录,且有领导认可;(2) 本系统的数据存储至少应包含:设备记录、修理记录、报废记录、购买申请;(3) 本系统的输入项至少包含:新设备信息、修理信息、申请购买信息、报废信息、具体查询统计要求;(4) 本系统的输出项至少包含:设备购买申请表、修理/报废注销/设备资金统计表。
    2020-12-02下载
    积分:1
  • 数据预处理 剔除奇异值点 matlab代码
    数据预处理 剔除奇异值点 matlab代码
    2020-12-01下载
    积分:1
  • 控制系统稳定性分析的matlab实现(实验报告图+序全)
    一、 实验目的1. 熟悉MATLAB的仿真及应用环境2. 在MATLAB的环境下研究控制系统稳定性二、 实验内容和要求1. 学会使用MATLAB中的代数稳定判据判别系统稳定性2. 学会使用MATLAB中的根轨迹法判别系统稳定性3. 学会使用MATLAB中的频域法判别系统稳定性三、 实验主要仪器和材料1、 PC 1台2、 实验软件:MATLAB 7.1四、 实验方法,步骤及结果测试一) 用系统特征方程的根判别系统稳定性:设系统特征方程为 ,计算特征根并判别该系统的稳定性。在command widow窗口输入下列程序,并记录输出结果。>> p=[1 1 2 2 3 5
    2020-12-05下载
    积分:1
  • 2020年最新web寄生虫序.zip
    【实例简介】2020年最新web寄生虫程序,最新程序 泛目录,远程调用,SEO霸屏 站群最好程序 百度 搜狗 360 各大搜索引擎快速收录引蜘蛛爬行
    2021-11-06 00:35:24下载
    积分:1
  • STM32+MQTT+SIM800使用AT指令实现
    STM32+MQTT+SIM800使用AT指令实现;通过自建服务器测试完成,支持连接、订阅、发布、心跳保持;全部使用AT指令控制;
    2020-12-05下载
    积分:1
  • Notepad++的几个优秀主
    【实例简介】Notepad++是一款不错的编辑器,很轻巧,我很喜欢它。再换个主题,加个代码高亮,看上去就更专业了,让你同样拥有漂亮的编辑界面。
    2021-11-12 00:37:46下载
    积分:1
  • K均值聚类算法,图像处理,GUI,matlab
    利用K-means算法,在matlab环境下实现图像处理,具有GUI界面,形象的展现各种K值处理的效果!希望对大家有所帮助
    2020-07-02下载
    积分:1
  • 696518资源总数
  • 105540会员总数
  • 37今日下载