登录
首页 » C# » 一款用C#开发的网络爬虫程序

一款用C#开发的网络爬虫程序

于 2022-12-26 发布 文件大小:2.26 MB
0 89
下载积分: 2 下载次数: 1

代码说明:

ShootSearch是一款用C#开发的网络爬虫程序。其内核包含爬虫,存储,网页后期处理,索引生成等。 在抓取网页的过程中,可以灵活的制定多种规则,过滤URL,内置一个可无限增长的后继队列模块,可以随时暂停或者停止抓取,抓取的网页可以分时或者按照指 定大小切块存储(自定义的大文件系统)。 在网页的处理过程中,内置一个规则处理引擎,可以通过编写正则表达式灵活的提取或者过滤文字信息,将有用的信息存储到数据库(通用的数据库接口)或者 生成索引(支持Lucene和Hubble.NET)。 内置一个支持Lucene的中文切词模块。 基于Quartz.NET的任务调度(),每一个步骤(抓取,处理,生成索引)都是一个Job,每个Job都可以根据XML来灵活组合和扩充。 内置多种接口,开发人员可随时根据需求自己开发替换某个模块。

下载说明:请别用迅雷下载,失败请重下,重下不扣分!

发表评论

0 个回复

  • SHAPEMAP
    shp文件,包含世界各国最新地图,制作精良,适用于制作电子地图(SHAPEFILE,INCLUDE MAIN CONTRIES IN THE WORLD ,suitable to make eletroic map)
    2021-02-05 17:09:57下载
    积分:1
  • ZStack-CC2530-2.5.1a-DcMotor
    说明:  基于zigbee开发 CC2530的直流电机控制(Development of DC Motor Control Based on Zigbee CC2530)
    2020-12-28 23:39:02下载
    积分:1
  • HackerProgramming
    黑客编程技巧大全,非常用值得学习的一本书。(Hacker programming skills Daquan, very much worth learning to use a book.)
    2009-10-09 17:35:38下载
    积分:1
  • RS232_DO
    串行端口的数字输出控制,本程序使用两个按钮使得用户通过按钮控制DTR和RTS的引脚电压。(Serial port of the digital output control, the program allows users to use two buttons through the button control DTR and RTS pin voltage.)
    2008-03-11 13:58:32下载
    积分:1
  • MvcMusicStore-v3.0
    一个MVC3架构的网站,非常使用,有源码、CSS、数据库等等(A MVC3 web framework, very used, source, CSS, database, etc.)
    2013-07-09 09:53:05下载
    积分:1
  • HEAP
    poj 实现堆结构的源代码。。。话说其实没什么实际功能好么(poj achieve heap structure of the source code. . . In fact, the actual function of saying okay nothing)
    2013-11-21 23:03:15下载
    积分:1
  • bindCode2008
    AppWizard has created this BindFile application for you. This application not only demonstrates the basics of using the Microsoft Foundation classes but is also a starting point for writing your application. This file contains a summary of what you will find in each of the files that make up your BindFile application.(AppWizard has created this BindFile appli cation for you. This application not only demon strates the basics of using the Microsoft Found ation classes but is also a starting point for wr iting your application. This file contains a su mmary of what you will find in each of the files th at BindFile make up your application.)
    2007-06-07 14:12:17下载
    积分:1
  • pwmLight
    本程序主要的功能是通过PWM来进行光的亮度的调节(The main feature of this program is carried out by the PWM brightness adjustment of light)
    2011-12-10 09:26:35下载
    积分:1
  • SPWM
    利用定时器1的互补通道实现SPWM(图形测试实现一半)(Implementing SPWM with complementary channels of timer 1)
    2020-06-21 16:00:01下载
    积分:1
  • show
    模仿linux下的ls功能,显示文件属性(Mimic the ls functionality under linux display file attributes)
    2016-02-09 01:04:57下载
    积分:1
  • 696518资源总数
  • 106215会员总数
  • 5今日下载