登录
首页 » java,html » web爬虫工具,抓取网页

web爬虫工具,抓取网页

于 2022-03-19 发布 文件大小:3.59 MB
0 138
下载积分: 2 下载次数: 1

代码说明:

基于webcollector-2.12 开发,web爬虫工具,抓取网页,使用方便快捷。 WebCollector是一个无须配置、便于二次开发的JAVA爬虫框架(内核),它提供精简的的API,只需少量代码即可实现一个功能强大的爬虫。WebCollector-Hadoop是WebCollector的Hadoop版本,支持分布式爬取。 WebCollector致力于维护一个稳定、可扩的爬虫内核,便于开发者进行灵活的二次开发。内核具有很强的扩展性,用户可以在内核基础上开发自己想要的爬虫。源码中集成了Jsoup,可进行精准的网页解析。2.x版本中集成了selenium,可以处理javascript生成的数据。

下载说明:请别用迅雷下载,失败请重下,重下不扣分!

发表评论

0 个回复

  • java酒店管理系统实现代码
    该资源实现了酒店管理系统的基本功能,可以实现添加用户,订房,删除用户,退房,订餐,管理员管理等多种功能,虽然有些小的BUG,但是无伤大雅,对于一般的小酒店来说,基本功能是可以实现的,欢迎大家多多下载,多多送分,默默大。
    2022-03-23 01:43:49下载
    积分:1
  • 商城后台管理
    这是一个商城的后台管理系统,里面有管理员模块,用户管理模块,商品管理和分类,4大模块,可以上传图片,还有邮件通知注册的用户,C3P0连接池,DBUtil框架。MD5加密,和过滤器**********
    2022-02-04 18:33:31下载
    积分:1
  • 基于bootstrap+springMVC+hibernate/mybatis的快速开发平台
    封装完善的用户基础权限、强大的数据权限、和数据字典等基础功能,直接使用无需修改,常用共通封装,各种工具类(定时任务,短信接口,邮件发送,Excel导出等),基本满足80%项目需求,集成简易报表工具,图像报表和数据导出非常方便,可极其方便的生成pdf、excel、word等报表;集成工作流activiti,并实现了只需在页面配置流程转向,可极大的简化jbpm工作流的开发
    2023-04-15 09:30:12下载
    积分:1
  • 基于ssh图书网站
    这是一个Struts2+Hibernate+spring的网上图书贩卖系统,游客可以浏览图书,登录后可以购买书籍,管理员登录后可以管理书籍,包括增加,修改和删除。
    2022-02-03 21:09:31下载
    积分:1
  • 化妆品购物网站
    首先是登录和注册,有加入购物车的功能,查看订单的功能,以及删除订单的功能。主要是jsp编码,包括有javabean和servlet,大部分是MVC模式。
    2023-05-28 13:50:03下载
    积分:1
  • 网络漏洞扫描工具
    网络漏洞扫描工具网络漏洞扫描工具网络漏洞扫描工具网络漏洞扫描工具网络漏洞扫描工具网络漏洞扫描工具网络漏洞扫描工具网络漏洞扫描工具
    2022-07-28 08:49:32下载
    积分:1
  • 上传文件
    实现多文件批量上传,
    2023-08-10 07:20:03下载
    积分:1
  • 简单的人力管理系统
    人力资源管理系统有员工的增删改查 薪资的增删改查 用户管理 运用mysql数据库
    2022-05-28 11:33:23下载
    积分:1
  • JAVA酒店管理系统
    利用JS做的酒店管理系统,完成酒店客房的管理,顾客的入住,结账,及超市购物的结算;对酒店清洁人员能及时显示待打扫房间;对超市进货员能进行货物的购进与撤销;对人员变更只有S管理员才有权限!!!
    2023-04-09 14:30:19下载
    积分:1
  • 超市账单管理系统
    基于SSM框架的超市账单管理系统,适合刚学习Spring + SpringMVC + Mybatis 的道友下载浏览,该项目功能有登录推出,账单的管理,供应商管理以及用户的管理
    2022-12-24 19:00:08下载
    积分:1
  • 696516资源总数
  • 106457会员总数
  • 15今日下载