登录
首页 » 算法 » 问题分类

问题分类

于 2022-02-24 发布 文件大小:1.82 MB
0 126
下载积分: 2 下载次数: 1

代码说明:

TF-IDF(term frequency–inverse document frequency)是一种用于资讯检索与资讯探勘的常用加权技术, TFIDF的主要思想是:如果某个词或短语在一篇文章中出现的频率TF高,并且在其他文章中很少出现,则认为此词或者短语具有很好的类别区分能力,适合用来分类。TFIDF实际上是:TF * IDF,TF词频(Term Frequency),IDF反文档频率(Inverse Document Frequency)。TF表示词条在文档d中出现的频率。IDF的主要思想是:如果包含词条t的文档越少,也就是n越小,IDF越大,则说明词条t具有很好的类别区分能力。如果某一类文档C中包含词条t的文档数为m,而其它类包含t的文档总数为k,显然所有包含t的文档数n=m + k,当m大的时候,n也大,按照IDF公式得到的IDF的值会小,就说明该词条t类别区分能力不强。但是实际上,如果一个词条在一个类的文档中频繁出现,则说明该词条能够很好代表这个类的文本的特征,这样的词条应该给它们赋予较高的权重,并选来作为该类文本的特征词以区别与其它类文档。这就是IDF的不足之处。

下载说明:请别用迅雷下载,失败请重下,重下不扣分!

发表评论

0 个回复

  • mage128 8种LED点亮模式
    /******************************************************************************* Platform : ATmega128 mini开发板(http://bbs.armavr.com) Project  : 实验一:8种LED点亮模式 Clock F  : 7.3728M Software : WinAVR-20100110 Author   : 林夕依然 Version  : 11.04.27 Updata   :  comments : 1、以学习板八个LED灯为硬件电路,LED_EN短路块需装上 2、练习简单延时函数的编制 3、AVR单片机端口寄存器的使用及理解 4、练习程序模块化,结构化的书写
    2022-11-18 02:10:03下载
    积分:1
  • DES实现
    最精简的DES算法实现,让你能快速的了解DES的用法。
    2023-06-08 20:25:03下载
    积分:1
  • 一个薄板样条模型(thin plate spline)matlab源代码
    一个薄板样条模型(thin plate spline)matlab源代码-A thin plate spline model (thin plate spline) matlab source code
    2022-01-25 17:42:11下载
    积分:1
  • MS-PS实现
    MS-PS是data mining 的实用算法之一。其有多个minimum support, 对数据进行更有利的提取。得到想要的association rule 和sequential pattern.
    2022-11-26 22:30:04下载
    积分:1
  • 高效的乘函数,不用调用系统乘器,对没有乘器的系统来说非常有用....
    高效的乘法函数,不用调用系统乘法器,对没有乘法器的系统来说非常有用.-Efficient multiplication function, do not call the system multiplier, multiplier of the system is not very useful.
    2022-11-11 02:45:03下载
    积分:1
  • c/c++编写的一个日历程序
    是c/c++编写的一个算法程序,在VC6.0里执行该程序之后,会显示年月日,并且该年月日是当天的时间,对于c/c++的编写有一定的参考性,可以以此为基础进行其他程序的移植。
    2022-09-14 16:15:03下载
    积分:1
  • 点与多边形关系判断
    适用于初学者的C#源代码,教你学会画点画线和画面,并且能判断点与折线以及点与多边形的位置关系。代码清晰易懂,重点处附有注释。
    2022-06-15 15:21:33下载
    积分:1
  • HMM
    Contents of this directory PROGRAMS  * Simple HMMs *  simpledemo.m - Simple demo of HMM code hmm.m - hmm code hmm_cl.m - code for calculating likelihood for an hmm  * Factorial HMMs * fhmm.m - factorial HMM code (exact algorithm -- very slow)
    2022-04-14 22:21:46下载
    积分:1
  • MD5校验和源码
    MD5校验和算法源码-MD5 checksum algorithm source
    2022-03-31 11:30:53下载
    积分:1
  • 矩阵计数器,用VC++实现了矩阵的一般运(加减乘),以及求逆求行列式值,和转置等运...
    矩阵计数器,用VC++实现了矩阵的一般运算(加减乘),以及求逆求行列式值,和转置等运算-matrix counter, with VC++ implementation of the matrix of the general computing (plus or minus x), and inverse seeking determinant value, and home to such operations
    2022-02-01 17:22:09下载
    积分:1
  • 696518资源总数
  • 105540会员总数
  • 37今日下载