-
万年历delphi源码(都农历,农历节气)
万年历delphi源码(都农历,农历节气)
-Calendar delphi source code (both Lunar, Lunar Solar Terms)
- 2023-06-21 14:40:03下载
- 积分:1
-
基于贝叶斯技术的邮件过滤的编程实现,SQL Sever 2000中的邮件邮件数据库...
基于贝叶斯技术的邮件过滤的编程实现,SQL Sever 2000中的邮件邮件数据库-E-mail based on Bayesian filtering technology, programming
- 2022-04-28 18:51:55下载
- 积分:1
-
AI game ... Addison Wesley
AI game ... Addison Wesley - Gamma, Helm, Johnson, Vlissides - Design Patterns, Elements of Reusable Object Oriented Software, 1998.pdf-AI game ......Addison Wesley- Gamma, Helm, Johnson, Vlissides- Design Patterns, Elements of Reusable Object Oriented Software, 1998.pdf
- 2022-06-03 20:05:18下载
- 积分:1
-
常规优化算法库,处理具有约束力和非
常规优化算法程序库,处理各种有约束和无约束优化问题-conventional optimization algorithm library, to deal with binding and non-constrained optimization problem
- 2022-02-26 21:08:05下载
- 积分:1
-
用VC写的一个限制鼠标位置的小程序
用VC写的一个限制鼠标位置的小程序-VC write a restricted location of the mouse small programs
- 2023-01-26 19:50:03下载
- 积分:1
-
简单的动态曲线程序
该程序在visual-studio 2008下开发,可以实现实时曲线绘制,先按下鼠标左键,在按着左键并移动鼠标,鼠标移到哪,曲线绘制到哪,但不显示鼠标位置。
- 2023-06-04 09:40:03下载
- 积分:1
-
饼型的进度显示窗口
饼型的进度显示窗口-pie progress indicates window
- 2023-04-26 07:10:02下载
- 积分:1
-
搜索引擎
爬虫模块、预处理模块和搜索模块。
搜索引擎的三个部分是相互独立的,三个部分分别工作,主要的关系体现在前一部分得到的数据结果为后一部分提供原始数据。
用户通过浏览器提交查询的词或者短语 P,搜索引擎根据用户的查询返回匹配的网页信息列表 L;
上述过程涉及到两个问题,如何匹配用户的查询以及网页信息列表从何而来,根据什么而排序?用户的查询 P 经过分词器被切割成小词组 并被剔除停用词 ( 的、了、啊等字 ),根据系统维护的一个倒排索引可以查询某个词 pi 在哪些网页中出现过,匹配那些 都出现的网页集即可作为初始结果,更进一步,返回的初始网页集通过计算与查询词的相关度从而得到网页排名,即 Page Rank,按照网页的排名顺序即可得到最终的网页列表;
假设分词器和网页排名的计算公式都是既定的,那么倒排索引以及原始网页集从何而来?原始网页集在之前的数据流程的介绍中,可以得知是由爬虫 spider 爬取网页并且保存在本地的,而倒排索引,即词组到网页的映射表是建立在正排索引的基础上的,后者是分析了网页的内容并对其内容进行分词后,得到的网页到词组的映射表,将正排索引倒置即可得到倒排索引;
网页的分析具体做什么呢?由于爬虫收集来的原始网页中包含很多信息,比如 html 表单以及一些垃圾信息比如广告,网页分析去除这些信息,并抽取其中的正文信息作为后续的基础数据。
- 2022-05-07 14:54:09下载
- 积分:1
-
gis 系统 vc 开发的简单入门级别的gis系统
gis 系统 vc 开发的简单入门级别的gis系统-gis
- 2022-02-25 06:22:38下载
- 积分:1
-
This is a set of procedures for beginners
这是java的一套程序,适合初学者-This is a set of procedures for beginners
- 2022-06-20 15:59:10下载
- 积分:1