-
G.723.1编码,不能直接使用,需进行必要的修改,其中一些…
G723.1代码,不可直接使用,需进行必要的修改,其中有些错误
-G723.1 code, not directly use, the need for the necessary changes, some of which are wrong
- 2022-03-07 01:14:47下载
- 积分:1
-
汇编语言的好东西,,电子时钟显示
汇编语言的好东西,,电子时钟显示-language compilation good things, the electronic clock display
- 2022-02-04 02:07:19下载
- 积分:1
-
wince 5.0 MFC EVC 4.0应用程序
wince 5.0 MFC EVC 4.0应用程序-wince 5.0 MFC EVC 4.0 application
- 2022-04-27 04:38:10下载
- 积分:1
-
这个是vc开发中清除临时文件的一个批处理工具,很方便
这个是vc开发中清除临时文件的一个批处理工具,很方便-vc development is the removal of a temporary batch tools, convenient
- 2022-03-12 04:21:10下载
- 积分:1
-
NFC刷卡封装dll库
NFC刷卡系统上位机驱动程序,封装成dll动态链接库,方便PB、vb等程序直接调用dll提供的借口,实现对NFC的读卡操作。已编译通过,测试可行。
- 2022-05-16 03:30:20下载
- 积分:1
-
档案管理系统,vb写的
档案管理系统,vb写的-file management system, written in vb
- 2022-03-02 20:14:54下载
- 积分:1
-
实现文件压缩的一个派生类,不错
实现文件压缩的一个派生类,不错-achieve compression of a derived class, it is true
- 2022-03-11 04:44:07下载
- 积分:1
-
蝴蝶在自然界
butterfly on nature-butterfly on nature
- 2022-01-28 21:05:30下载
- 积分:1
-
搜索引擎
爬虫模块、预处理模块和搜索模块。
搜索引擎的三个部分是相互独立的,三个部分分别工作,主要的关系体现在前一部分得到的数据结果为后一部分提供原始数据。
用户通过浏览器提交查询的词或者短语 P,搜索引擎根据用户的查询返回匹配的网页信息列表 L;
上述过程涉及到两个问题,如何匹配用户的查询以及网页信息列表从何而来,根据什么而排序?用户的查询 P 经过分词器被切割成小词组 并被剔除停用词 ( 的、了、啊等字 ),根据系统维护的一个倒排索引可以查询某个词 pi 在哪些网页中出现过,匹配那些 都出现的网页集即可作为初始结果,更进一步,返回的初始网页集通过计算与查询词的相关度从而得到网页排名,即 Page Rank,按照网页的排名顺序即可得到最终的网页列表;
假设分词器和网页排名的计算公式都是既定的,那么倒排索引以及原始网页集从何而来?原始网页集在之前的数据流程的介绍中,可以得知是由爬虫 spider 爬取网页并且保存在本地的,而倒排索引,即词组到网页的映射表是建立在正排索引的基础上的,后者是分析了网页的内容并对其内容进行分词后,得到的网页到词组的映射表,将正排索引倒置即可得到倒排索引;
网页的分析具体做什么呢?由于爬虫收集来的原始网页中包含很多信息,比如 html 表单以及一些垃圾信息比如广告,网页分析去除这些信息,并抽取其中的正文信息作为后续的基础数据。
- 2022-05-07 14:54:09下载
- 积分:1
-
Windows CE开发指南!吐血推荐!英文原版!Windows CE开发工程师的必备资料!...
Windows CE开发指南!吐血推荐!英文原版!Windows CE开发工程师的必备资料!-Guide to the development of Windows CE! Suggest to vomit blood! English original! Windows CE development engineers the necessary information!
- 2022-11-17 08:50:04下载
- 积分:1