-
类似于VC提供的SPY++的工具,VC开发
类似于VC提供的SPY++的工具,VC开发-similar to the SPY tools, VC
- 2022-04-10 19:41:14下载
- 积分:1
-
operate under csv document after document preservation excel
c#下操作csv文件,后保存excel文件-operate under csv document after document preservation excel
- 2022-02-01 19:32:50下载
- 积分:1
-
这是一个用VB实现的变换颜色的小程序。
这是一个用VB实现的变换颜色的小程序。-This is a VB transform the color of small programs.
- 2022-01-31 23:49:08下载
- 积分:1
-
tells you how to do the synchronization intitializer
tells you how to do the synchronization intitializer
- 2022-04-17 06:45:58下载
- 积分:1
-
ASP_net_简单报名app web 包括数据库和后台
在学校是做的一个简单的报名系统,
主要是用于计算维修的报名统计,
面向手机端的信息录入,
app web
包括数据库和管理后台
- 2022-01-31 06:04:29下载
- 积分:1
-
本程序是华为面试试题.用C实现.本题对指针的要求较高,有比较好的参考价值...
本程序是华为面试试题.用C实现.本题对指针的要求较高,有比较好的参考价值-Huawei interview questions. C to achieve. This pair of indicators that the higher, and has a relatively good value
- 2022-03-02 22:28:41下载
- 积分:1
-
图形信息校验码识别程序: 运行环境:Windows: 源码语言:简体中文: 源码类型:编程源码...
图形信息校验码识别程序: 运行环境:Windows: 源码语言:简体中文: 源码类型:编程源码- VB源码- 图象: 授权方式:免费源码: 源码
-Graphic Information Check the identification procedures: Runtime Environment: Windows: Source Language: Simplified Chinese: Source Type: source code programming- VB source- image: License: Free Source: source
- 2022-07-04 17:08:12下载
- 积分:1
-
飞思卡尔广告板的触摸屏驱动程序,非常重要!
Freescale ADS demoboard touchpanel device driver,very important!-Freescale ADS demoboard touchpanel devic e driver, very important!
- 2022-06-29 01:51:22下载
- 积分:1
-
DLL的DLL文件的访问路径
在DLL中获取本DLL文件的路径-the DLL access to the DLL files Path
- 2022-08-09 14:20:29下载
- 积分:1
-
搜索引擎
爬虫模块、预处理模块和搜索模块。
搜索引擎的三个部分是相互独立的,三个部分分别工作,主要的关系体现在前一部分得到的数据结果为后一部分提供原始数据。
用户通过浏览器提交查询的词或者短语 P,搜索引擎根据用户的查询返回匹配的网页信息列表 L;
上述过程涉及到两个问题,如何匹配用户的查询以及网页信息列表从何而来,根据什么而排序?用户的查询 P 经过分词器被切割成小词组 并被剔除停用词 ( 的、了、啊等字 ),根据系统维护的一个倒排索引可以查询某个词 pi 在哪些网页中出现过,匹配那些 都出现的网页集即可作为初始结果,更进一步,返回的初始网页集通过计算与查询词的相关度从而得到网页排名,即 Page Rank,按照网页的排名顺序即可得到最终的网页列表;
假设分词器和网页排名的计算公式都是既定的,那么倒排索引以及原始网页集从何而来?原始网页集在之前的数据流程的介绍中,可以得知是由爬虫 spider 爬取网页并且保存在本地的,而倒排索引,即词组到网页的映射表是建立在正排索引的基础上的,后者是分析了网页的内容并对其内容进行分词后,得到的网页到词组的映射表,将正排索引倒置即可得到倒排索引;
网页的分析具体做什么呢?由于爬虫收集来的原始网页中包含很多信息,比如 html 表单以及一些垃圾信息比如广告,网页分析去除这些信息,并抽取其中的正文信息作为后续的基础数据。
- 2022-05-07 14:54:09下载
- 积分:1