登录
首页 » java,html » web爬虫工具,抓取网页

web爬虫工具,抓取网页

于 2022-03-19 发布 文件大小:3.59 MB
0 89
下载积分: 2 下载次数: 1

代码说明:

基于webcollector-2.12 开发,web爬虫工具,抓取网页,使用方便快捷。 WebCollector是一个无须配置、便于二次开发的JAVA爬虫框架(内核),它提供精简的的API,只需少量代码即可实现一个功能强大的爬虫。WebCollector-Hadoop是WebCollector的Hadoop版本,支持分布式爬取。 WebCollector致力于维护一个稳定、可扩的爬虫内核,便于开发者进行灵活的二次开发。内核具有很强的扩展性,用户可以在内核基础上开发自己想要的爬虫。源码中集成了Jsoup,可进行精准的网页解析。2.x版本中集成了selenium,可以处理javascript生成的数据。

下载说明:请别用迅雷下载,失败请重下,重下不扣分!

发表评论

0 个回复

  • 网上书城
    基于java web开发的网上书城,身份包括管理员和普通用户,功能包括用户注册,登陆,保存密码,购物车,购买,订单查询,付钱等一系列功能,各项功能与淘宝一致
    2022-08-16 03:27:08下载
    积分:1
  • 粉色个人网站
    一个清新粉色个人网站,简单的静态网站,里面有六个页面,基于html,对于初学者具有很好的 指导和教学作用。
    2022-06-17 02:16:40下载
    积分:1
  • web综合教学管理系统项目源代码(Eclipse)
    详见 说明文档,在文档中,共涉及了WebEDU项目的六个功能块,包含: Ø        论坛管理:所对应的包为BbsManage Ø        消息管理: 所对应的包为MessageManage Ø        用户管理: 所对应的包为StudentManage Ø        教员管理: 所对应的包为TeacherManage Ø        学员管理: 所对应的包为UserManage 请点击左侧文件开始预览 !预览只提供20%的代码片段,完整代码需下载后查看 加载中 侵权举报
    2022-03-22 17:30:38下载
    积分:1
  • java EE课本源代码
    这个是有关与java ee课本的源代码!!!!!!!!!详细齐全,应有尽有。。。。。想要的就自己提取把,哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈
    2023-08-15 21:25:05下载
    积分:1
  • 毕业设计选题系统
    基于工作流的毕业设计管理系统-过程管理子系统,基于工作流的毕业设计管理系统-答辩管理子系统,基于工作流的毕业设计管理系统-统计分析子系统
    2022-02-03 10:04:52下载
    积分:1
  • 网络订餐
    该系统实现了网络订餐功能,代码清晰,功能完整,界面友好。
    2022-07-08 10:55:53下载
    积分:1
  • 化妆品购物网站
    首先是登录和注册,有加入购物车的功能,查看订单的功能,以及删除订单的功能。主要是jsp编码,包括有javabean和servlet,大部分是MVC模式。
    2023-05-28 13:50:03下载
    积分:1
  • 传智CRM模板
    根据传智的教学视频自己编写的crm项目,还原度能达到80%以上吧,适合初学者分析代码用
    2022-02-09 19:32:57下载
    积分:1
  • draw3.0
    draw3.0draw3.0draw3.0draw3.0draw3.0draw3.0draw3.0draw3.0draw3.0draw3.0draw3.0draw3.0draw3.0draw3.0draw3.0draw3.0draw3.0draw3.0draw3.0draw3.0draw3.0draw3.0draw3.0draw3.0draw3.0draw3.0draw3.0draw3.0draw3.0draw3.0draw3.0draw3.0draw3.0draw3.0draw3.0draw3.0draw3.0draw3.0draw3.0draw3.0draw3.0draw3.0draw3.0draw3.0draw3.0draw3.0draw3.0draw3.0draw3.0draw3.0draw3.0
    2022-01-25 15:29:28下载
    积分:1
  • 个人网站源码
    个人网站源码包含主页面,内容,文章,分页,使用mysql数据库,tomcat,前台代码是响应式;个人网站源码包含主页面,内容,文章,分页,使用mysql数据库,tomcat,前台代码是响应式;个人网站源码包含主页面,内容,文章,分页,使用mysql数据库,tomcat,前台代码是响应式;个人网站源码包含主页面,内容,文章,分页,使用mysql数据库,tomcat,前台代码是响应式
    2022-01-22 00:52:03下载
    积分:1
  • 696518资源总数
  • 105554会员总数
  • 2今日下载