登录
首页 » 算法 » 问题分类

问题分类

于 2022-02-24 发布 文件大小:1.82 MB
0 219
下载积分: 2 下载次数: 1

代码说明:

TF-IDF(term frequency–inverse document frequency)是一种用于资讯检索与资讯探勘的常用加权技术, TFIDF的主要思想是:如果某个词或短语在一篇文章中出现的频率TF高,并且在其他文章中很少出现,则认为此词或者短语具有很好的类别区分能力,适合用来分类。TFIDF实际上是:TF * IDF,TF词频(Term Frequency),IDF反文档频率(Inverse Document Frequency)。TF表示词条在文档d中出现的频率。IDF的主要思想是:如果包含词条t的文档越少,也就是n越小,IDF越大,则说明词条t具有很好的类别区分能力。如果某一类文档C中包含词条t的文档数为m,而其它类包含t的文档总数为k,显然所有包含t的文档数n=m + k,当m大的时候,n也大,按照IDF公式得到的IDF的值会小,就说明该词条t类别区分能力不强。但是实际上,如果一个词条在一个类的文档中频繁出现,则说明该词条能够很好代表这个类的文本的特征,这样的词条应该给它们赋予较高的权重,并选来作为该类文本的特征词以区别与其它类文档。这就是IDF的不足之处。

下载说明:请别用迅雷下载,失败请重下,重下不扣分!

发表评论

0 个回复

  • k--mean 实现聚类
    这是一个用c++编写的k-mean程序,完全能够实现聚类算法,可以帮助大家学习c++和聚类算法!
    2022-07-10 08:15:36下载
    积分:1
  • 蓝桥杯-六角幻方-代码
    应用背景 这是蓝桥杯往年的一个题目,类似的题目有六角填数、4*4魔方阵等。题目如下图: 将1,2,3,...19填进去,图中已经填了两个数15和13,填完后要求每条直线上的数字之和相等,图中共有十五条直线。 关键技术代码在VS2010上运行。 设和为a, 则a*15/3=(1+19)/2*19  所以 a=38 前两个数已经填好,开始填第三个数,将满足vis=0的数依次填进去。填完第三个数,第一行已经形成了直线,判断第一行的和是不是38. 填完第七个数,新增加了一条直线(第二行),判断它的和。填完第八个数,增加了一条线(45°方向),判断其和。以此类推。程序关键是:每填完一个数,看有没有新增加的直线,并判断数字和,不能全部填完19个数再判断,因为计算量太大,程序运行不出来。
    2022-02-07 04:51:19下载
    积分:1
  • 生成随机数与单个服务器
    你好!注意,平均队列长度的理论回答是到达顾客在本系统中的H /(1–H),H是一个客户的平均服务时间,“a”是连续的客户的到达之间的平均时间。乐趣与此代码!!!
    2022-10-04 04:45:03下载
    积分:1
  • CalibCamera with cnoners具有脚点提取的摄像机标定程序
    资源描述 利用摄像机所拍摄到的图像来还原空间中的物体。假设摄像机所拍摄到的图像与三维空间中的物体之间存在以下一种简单的线性关系:[像]=M[物],这里,矩阵M可以看成是摄像机成像的几何模型。 M中的参数就是摄像机参数。通常,这些参数是要通过实验与计算来得到的。这个求解参数的过程就称为摄像机标定。 在这个程序里,有测试图片,编写了基于OpenCV角点提取的摄像机标定程序,绝对好用!
    2022-12-17 19:40:04下载
    积分:1
  • 用C写的,在VC上编译通过,可以查看运行结果,代码没写注释...
    用C写的,在VC上编译通过,可以查看运行结果,代码没写注释-written in C, compiled by VC can see the operational results, I did not write code Notes
    2022-01-22 02:25:43下载
    积分:1
  • 瑞萨读iic
    应用背景为参加电子设计大赛的朋友带来一点好处,有利于大家共同进步,共同发展,同时省去了好多时间。减少大家走弯路的概率。关键技术瑞萨单片机的使用,大多数还是在竞赛中,它独特的编程习惯是初学者非常不适应,我根据自己的经验,以及想法将持续分享给大家,让大家更好的开发,利用。
    2022-04-29 13:40:40下载
    积分:1
  • 2层神经网络的LabVIEW实现。反向误差传播…
    LabVIEW implementation of neural net with 2 layers. Back Error Propagation learning example.
    2022-03-20 04:25:55下载
    积分:1
  • 一个利用KDD1999数据集而完成的改进K
    一个利用KDD1999数据集而完成的改进K-means聚类算法的实现.-A use of data sets KDD1999 completed to improve the K-means clustering algorithm.
    2022-01-25 16:52:25下载
    积分:1
  • C实现RS编码
    用C实现RS码纠错仿真 RS码的编码程序 编码效率高,且经实际验证符合RS纠错码的要求-RS code using C realize simulation RS error correction code encoding procedure coding efficient and practical to verify compliance with the requirements of RS error-correcting codes
    2023-05-05 14:10:03下载
    积分:1
  • including large numbers of calculating the arithmetic
    大数的计算包括加减乘除-including large numbers of calculating the arithmetic
    2022-02-05 22:22:15下载
    积分:1
  • 696516资源总数
  • 106627会员总数
  • 16今日下载