登录
首页 » 算法 » 问题分类

问题分类

于 2022-02-24 发布 文件大小:1.82 MB
0 59
下载积分: 2 下载次数: 1

代码说明:

TF-IDF(term frequency–inverse document frequency)是一种用于资讯检索与资讯探勘的常用加权技术, TFIDF的主要思想是:如果某个词或短语在一篇文章中出现的频率TF高,并且在其他文章中很少出现,则认为此词或者短语具有很好的类别区分能力,适合用来分类。TFIDF实际上是:TF * IDF,TF词频(Term Frequency),IDF反文档频率(Inverse Document Frequency)。TF表示词条在文档d中出现的频率。IDF的主要思想是:如果包含词条t的文档越少,也就是n越小,IDF越大,则说明词条t具有很好的类别区分能力。如果某一类文档C中包含词条t的文档数为m,而其它类包含t的文档总数为k,显然所有包含t的文档数n=m + k,当m大的时候,n也大,按照IDF公式得到的IDF的值会小,就说明该词条t类别区分能力不强。但是实际上,如果一个词条在一个类的文档中频繁出现,则说明该词条能够很好代表这个类的文本的特征,这样的词条应该给它们赋予较高的权重,并选来作为该类文本的特征词以区别与其它类文档。这就是IDF的不足之处。

下载说明:请别用迅雷下载,失败请重下,重下不扣分!

发表评论

0 个回复

  • C语言推箱子
    资源描述 基于C语言的小游戏推箱子源码,在X-code中运行的,同时,可以在其他工具中实现。
    2022-01-22 14:30:43下载
    积分:1
  • 用标准C语言解决100道经典数学问题,堪称经典,是C程序开发员必备的C源码库,具有很强的参考价值。...
    用标准C语言解决100道经典数学问题,堪称经典,是C程序开发员必备的C源码库,具有很强的参考价值。-using standard C language to solve 100 classical mathematical problems for his classic, C procedures required developers of C source code library, and has a strong reference value.
    2023-05-09 00:30:03下载
    积分:1
  • 系统辨识,递推最小二乘(RLS)辨识方
    系统辨识中,递推最小二乘估计(RLS)是辨识模型阶次的一个重要的算法。该程序通过实现该算法,得到模型阶次的估计值以及相关参数值。-system identification, recursive least squares estimation (RLS) identification model is of the order of an important algorithm. The program through the realization of the algorithm, to be model order and the estimated value of the relevant parameters.
    2022-07-05 08:15:06下载
    积分:1
  • 对数回归方程logarithmregress.cs方程模型y = * LN…
    对数回归方程 LogarithmRegress.cs 方程模型为 Y=a*LnX+b public override double[] buildFormula() 得到系数数组,存放顺序与模型系数相反,即该数组中系数的值依次是b,a。 public override double forecast(double x) 预测函数,根据模型得到预测结果。 public override double computeR2() 计算相关系数(决定系数),系数越接近1,数据越满足该模型。 -Logarithmic regression equation LogarithmRegress.cs equation model for Y = a* LnX+ Bpublic override double [] buildFormula () get coefficient array, the storage order and model coefficients contrary, that is, the array is followed by the value of coefficient b, a. public override double forecast (double x) prediction function, according to the results of model prediction. public override double computeR2 () calculated the correlation coefficient (determination coefficient), coefficient of the closer one, the data satisfy the model more.
    2022-08-31 23:15:03下载
    积分:1
  • 大学里数学系必学的一们课程数值分析中的经典――――hermit插值的程序vb版本...
    大学里数学系必学的一们课程数值分析中的经典算法――――hermit插值的程序vb版本-University"s Department of Mathematics will study the courses have a numerical analysis of the classic interpolation algorithm- hermit version of the procedure vb
    2023-05-04 21:55:03下载
    积分:1
  • 发表在今年2007年Science上的一篇论文的代码实现,一种新的有效的聚类...
    发表在今年2007年Science上的一篇论文的代码实现,一种新的有效的聚类算法-Published in Science this year, in 2007 a paper on the code, a new and effective clustering algorithm
    2022-02-14 18:15:22下载
    积分:1
  • 数值库for Windows,含有很多数值
    数值算法库for Windows,含有很多数值算法-numerical algorithm library for Windows, contain many numerical algorithm
    2023-01-04 12:45:03下载
    积分:1
  • With regard to the three branches of the tree, which is less than the total numb...
    关于分支为3的树,它的节点种类总数小于7,深度为3,全探索的源代码-With regard to the three branches of the tree, which is less than the total number of nodes of type 7, a depth of 3, all to explore the source code
    2022-02-25 16:04:50下载
    积分:1
  • 一个简单的例子多线程
    一个简单的多线程的例子-a simple example Multithreading
    2022-10-02 17:10:03下载
    积分:1
  • 这事lanrange插值实例
    这事lanrange插值算法实例-this interpolation algorithm examples lanrange
    2022-03-10 20:26:05下载
    积分:1
  • 696518资源总数
  • 104225会员总数
  • 32今日下载