抄袭检测算法和同义词的识别与筛选
于 2022-01-25 发布
文件大小:48.49 MB
0 55
下载积分: 2
下载次数: 1
代码说明:
应用背景这是一个程序来检测在印尼语词文本抄袭,尤其是PDF文件。在这个项目中,我使用Java作为编程语言,采用风选法来检测类似的词语,并使用滚动哈希算法计算哈希值。对于同义词,我使用同义词识别算法。它可以处理任何同义词,但不能处理相反的话;关键技术一个Java的Windows应用程序。 ;我使用db4o(数据库对象)来存储数据字典。我使用面向对象程序设计作为结构程序。为主要的算法,我用风选算法检测抄袭的字符串计算哈希值。每个字符串将被转换为哈希值,并且每个哈希值将被另一个哈希值检查。如果他们有相似的哈希值,和相似性值超过50%,那么它可以被称为抄袭
下载说明:请别用迅雷下载,失败请重下,重下不扣分!
发表评论