-
tf-idf Java实现,还是很不错的
资源描述TF-IDF(term frequency–inverse document frequency)是一种用于资讯检索与资讯探勘的常用加权技术, TFIDF的主要思想是:如果某个词或短语在一篇文章中出现的频率TF高,并且在其他文章中很少出现,则认为此词或者短语具有很好的类别区分能力,适合用来分类。TFIDF实际上是:TF * IDF,TF词频(Term Frequency),IDF反文档频率(Inverse Document Frequency)。TF表示词条在文档d中出现的频率。IDF的主要思想是:如果包含词条t的文档越少,也就是n越小,IDF越大,则说明词条t具有很好的类别区分能力。如果某一类文档C中包含词条t的文档数为m,而其它类包含t的文档总数为k,显然所有包含t的文档数n=m + k,当m大的时候,n也大,按照IDF公式得到的IDF的值会小,就说明该词条t类别区分能力不强。但是实际上,如果一个词条在一个类的文档中频繁出现,则说明该词条能够很好代表这个类的文本的特征,这样的词条应该给它们赋予较高的权重,并选来作为该类文本的特征词以区别与其它类文档。这就是IDF的不足之处。这里采用了外部插件IKAnalyzer-2012.jar,用其进行分词,插件和测试文件可以从这里下载
- 2022-11-20 22:00:04下载
- 积分:1
-
Java web 实现下载功能部分代码
用于Javaweb 实现下载功能
- 2022-01-26 08:35:54下载
- 积分:1
-
基站代码
这是一个比较好的基站定位算法,主要运用三角质心算法来做的,比较准确!!!运用三角形质心算法,得出手机当前的位置信息。三角形质心定位算法的基本思想 是:计算三圆交叠区域的 3 个特征点的坐标,以这三个点为三角形的顶点,未知点即为三角形质心。特征点为 E,F,G,特征点E 点的计算方法为[3]: 同理,可计算出 F,G,此时未知点的坐标为 。但是二次 方程,求解过程计算量较大,将式(3)中的方程式两两相减,则分别得到每条交线的直线 方程,特征点 E 的坐标则可以通过这些直线方程求解,如下三个直线方程式: 1: 2(Xb-Xa)Xe+2(Yb-Ya)Ye=ra*ra-rb*rb-Xa*Xa+Xb*Xb-Ya*Ya+Yb*Yb 2: 2(Xb-Xc)Xe+2
- 2022-06-12 13:40:32下载
- 积分:1
-
论坛代码asp
$(document).ready(function(){
$("#userstatus").load("js_read.asp?keys=dl&ran="+Math.random());
});
- 2022-03-07 07:56:25下载
- 积分:1
-
AES密钥生成
应用背景应用效果良好,为16位或32位或64位密钥大小。关键技术它是各种密钥大小写,它分为不同的模块,很好理解的代码
- 2022-03-20 07:49:34下载
- 积分:1
-
产品防伪查询系统
资源描述产品防伪查询系统产品防伪查询系统产品防伪查询系统产品防伪查询系统产品防伪查询系统产品防伪查询系统
- 2022-06-30 13:03:44下载
- 积分:1
-
java绘图板(多功能)
这是一个用java写的绘图板,包含菜单,可以编辑颜色,可以实现橡皮擦,随笔画,矩形,圆形等,并且可以对图形进行填充。还可以输入文字,并且设置文字格式。
- 2022-08-26 12:21:29下载
- 积分:1
-
连连看的核心程序代码java
简单的连连看游戏核心代码,它要求我们设计出这样一个连连看游戏,考察的是里面最最基本的算法知识, 先来了解下连连看的规则: 1 用户可以把两个相同的图用线连到一起,如果连线拐的弯不超过两个(可以等于)则表示可以消去。 2 当界面上所有的图片都消去后,则游戏胜利。 3 游戏的过程中可能出现这样一种情况,即运用规则再也无法消去任何两个图形了,那么可以利用重置来解除死锁。核心思想:本代码利用连连看核心思想,才用连通法进行同值抵消,即直连法,一折连通法,和二折连通抵消法,最终完成连连看游戏。 &n
- 2022-03-06 13:16:48下载
- 积分:1
-
在一个句子里的JavaScript。
应用背景一种用于计算句子中的单词和用于教育目的的一种语言脚本代码;关键技术一种教学生如何用逻辑感觉到代码的脚本语言的教育工具;
- 2023-04-23 11:50:03下载
- 积分:1
-
基于java开发的p2p 的源代码
基于java开发的p2p 的源代码,里面都是源代码
- 2022-04-22 15:21:01下载
- 积分:1