-
simHash,用来网页去重最常用的hash方法,速度很快.
Simhash
传统IR领域内文本相似度比较所采用的经典方法是文本相似度的向量夹角余弦,其主要思想是根据一个文章中出现词的词频构成一个向量,然后计算两篇文章对应向量的向量夹角。但由于有可能一个文章的特征向量词特别多导致整个向量维度很高,使得计算的代价太大,对于Google这种处理万亿级别的网页的搜索引擎而言是不可接受的,simhash算法的主要思想是降维,将高维的特征向量映射成一个f-bit的指纹(fingerprint),通过比较两篇文章的f-bit指纹的Hamming Distance来确定文章是否重复或者高度近似。
simhash算法很精巧,但却十分容易理解和实现,具体的simhash过程如下:
请点击左侧文件开始预览 !预览只提供20%的代码片段,完整代码需下载后查看 加载中 侵权举报
- 2022-11-14 00:20:04下载
- 积分:1
-
自动扫雷
资源描述基于c语言的自动扫雷程序,通过调用系统函数进行与相关游戏进行连接
- 2022-01-28 15:44:39下载
- 积分:1
-
以及操作说明
应用背景以及操作说明以及操作说明一个简单的RTSP,有两个DLL,一 ;是一个网络设置,其他 ;是一个游戏设置,以及操作的指令集一个简单的RTSP,有两个DLL,一 ;是一个网络的建立,另一;是一种游戏设置,以及操作说明关键技术backgroundfsdfadfsdfsdfsdfsdfsdfsdfdfdffsdfadfsdfsdfsdfsdfsdfsdfdfdffsdfadfsdfsdfsdfsdfsdfsdfdfdffsdfadfsdfsdfsdfsdfsdfsdfdfdffsdfadfsdfsdfsdfsdfsdfsdfdfdfkey技术124215141234123 124215141234123 124215141234123 124215141234123 124215141234123
- 2022-12-21 13:20:03下载
- 积分:1
-
C++语言编写的几何学算法模板。包括几何学的10多种基本的操作。例如点生成直线,叉积运算,线段的拐向,任意多边形面积的计算,点的位置判断,线段相交判断,求凸包等...
C++语言编写的几何学算法模板。包括几何学的10多种基本的操作。例如点生成直线,叉积运算,线段的拐向,任意多边形面积的计算,点的位置判断,线段相交判断,求凸包等等。-C++ Language template geometry algorithm. Including the geometry of more than 10 kinds of basic operation. For example, point to generate a straight line, fork plot computing, the segment拐向, arbitrary polygon area calculations to determine the location of the point, line segment intersection judge, and the convex hull and so on.
- 2023-01-01 05:25:03下载
- 积分:1
-
四轮全向移动足球机器人运动控制系统的研究
资源描述机器人作为人类最伟大的发明之一,长久以来一直受到国内外的研究人员的关
注,而足球机器人的研究无疑是智能机器人研究中最具有挑战的研究课题之一。它
涵j盖了自动控制技术、计算机技术、电子技术、智能控制邢论、传感器技术等诸多
学科的知识,基如此使得对足球机器人的研究已经成为了人工智能和机器人学的研
究热点。每年举办一次的RoboCup中型组足球机人比赛是典型的足球机器人的比赛
平台。中型组机器人比赛既是高科技应用于娱乐的一种体现,也是培养是人工智能、
自动化领域科技人才的重要窗口,同时也是促进足球机器人领域科技进步的有效途
径,其研究意义深远而重大。
- 2022-02-09 11:41:48下载
- 积分:1
-
基于Harris多尺度角点检测的图像配准新算法
为改进角点检测算子的检测性能,提高基于角点的图像配准算法的配准精度,把多分辨分析的思想引入到经典
的Harris角点检测中。构造了基于小波变换的灰度强度变化公式,并得到了具有尺度变换特性的自相关矩阵,从而构建
了一种新的Harris多尺度角点检测算法。这样,使得新的角点检测可以在不同的尺度下获取角点,并克服了单一尺度的
Harris角点检测可能存在的角点信息丢失、位置偏移和易受噪而提取出伪角点等问题。然后根据角度直方图得到的旋转
角度,和提取的以角点为中心的特征子图,定义了角点点对的对齐度。最后,运用最大化对齐度准则来精确地确定角点匹
配点对。实验表明,该配准算法具有精确性、有效性和抗噪性,实现了良好的配准效果。
- 2022-02-06 06:33:57下载
- 积分:1
-
用C语言编写牛顿插值程序
用C语言编写牛顿插值程序-C language Newton interpolation procedures
- 2022-03-24 20:26:09下载
- 积分:1
-
一个计算拉个朗日插值很好的程序,绝对正确无误。
一个计算拉个朗日插值很好的程序,绝对正确无误。-A calculation of long pull on a good interpolation procedure, is absolutely correct.
- 2022-04-30 12:50:43下载
- 积分:1
-
Esto es una libreria de crc16 que encontre por internet. La pongo aqui para que...
Esto es una libreria de crc16 que encontre por internet. La pongo aqui para que si quereis la utiliceis. Hasta ahora a mi me ha funcionado bastante bien
- 2022-07-01 19:14:29下载
- 积分:1
-
RexEpr计算器
驱蚊器我哈是老大时间考虑的哈萨克大家啊还是卡刷空间的那上面那层啊考试监考大师大师的快乐啊斯达康那是大陆是看得见老师都没拿
- 2022-07-24 10:55:44下载
- 积分:1