登录
首页 » 算法 » tf-idf中文

tf-idf中文

于 2022-07-08 发布 文件大小:1.02 kB
0 127
下载积分: 2 下载次数: 1

代码说明:

主要使用matlab编写的处理中文语料的tf-idf文档,可以实现对文本的词频及逆文本频率进行统计,得出每个词项的tf-idf权重进而对向量模型进行相似度分析,可进行文本分类等相关后续工作

下载说明:请别用迅雷下载,失败请重下,重下不扣分!

发表评论

0 个回复

  • c/c++ enthusiasts to learn a good example. For beginners improve the level of de...
    c/c++爱好者学习的一个很好的例子。对于提高初学者的水平,开拓思维有很大的帮助-c/c++ enthusiasts to learn a good example. For beginners improve the level of development thinking has a great help
    2022-03-22 18:06:10下载
    积分:1
  • is "commonly used computer numerical algorithms and procedures C version,&q...
    是《计算机常用数值计算算法与程序 C++版》一书的配套代码,每个源程序文件的文件扩展名都使用.cpp形式。这些C++程序已经在微软公司Windows 平台下的Virsual C++ 6.0环境下通过-is "commonly used computer numerical algorithms and procedures C version," a book supporting code, each source document file extensions are used. Cpp form. These procedures have been in C Microsoft Windows platform under the Virsual C 6.0 environment through
    2023-03-01 22:00:04下载
    积分:1
  • 蚁群解决TSP旅游商问题
    function [R_best,L_best,L_ave,Shortest_Route,Shortest_Length]=ACATSP(C,NC_max,m,Alpha,Beta,Rho,Q)%%-------------------------------------------------------------------------%% 主要符号说明%% C n个城市的坐标,n×2的矩阵%% NC_max 最大迭代次数%% m 蚂蚁个数%% Alpha 表征信息素重要程度的参数%% Beta 表征启发式因子重要程度的参数%% Rho 信息素蒸发系数%% Q 信息素增加强度系数%% R_best 各代最佳路线%% L_best 各代最佳路线的长度%%========================================================================= %%第一步:变量初始化n=size(C,1);%n表示问题的规模(城市个数)D=zeros(n,n);%D表示完全图的赋权邻接矩阵for i=1:nfor j=1:nif i~=jD(i,j)=((C(i,1)-C(j,1))^2+(C(i,2)-C(j,2))^2)^0.5;elseD(i,j)=eps;      %i=j时不计算,应该为0,但后面的启发因子要取倒数,用eps(浮点相对精度)表示endD(j,i)=D(i,j);   %对称矩阵endend%{1.C就是城市坐标             x         y城市1    0
    2022-08-25 13:59:52下载
    积分:1
  • This is an improved Euler algorithm source code
    这是改进的欧拉算法源码-This is an improved Euler algorithm source code
    2022-02-01 18:12:29下载
    积分:1
  • Java 随机化求PI
    通过随机化算法来求PI的值,在本代码中,(硬币)投的次数越多,PI的值越精确。里面有详细的说明
    2022-02-14 00:42:01下载
    积分:1
  • PIC LED HC595
    最喜欢所有组件功率 tử,或创建存储类风湿性关节炎、 检查 Soát 或转让权力方式方式起亚 không có.一张卡不工作从组件平等但合在一起的互操作性行动 " 取得预期成效。有许多人想了解功率器件 tử 和你从来没有真正能理解所有主题不是数字。
    2022-07-11 17:08:46下载
    积分:1
  • 短剩余时间第一 (SRT) 调度
    短剩余时间第一次调度的算法是算法的调度最好之一。在此我们使用通用时间的概念。而在每个第二的通用计数器将增加了一个,为用户提供的下一个最短进程搜索。
    2022-07-23 19:38:40下载
    积分:1
  • FFT的C++代码
    fft algorith and the c++ code
    2023-08-05 23:55:03下载
    积分:1
  • 文本比较
    program compare files in 2 directories. argv[1/2] - folder_1/2, argv[3] - file with result
    2022-12-09 11:30:03下载
    积分:1
  • 棋盘覆盖问题的源程序
    棋盘覆盖问题的算法源程序-chessboard coverage of the algorithm source code
    2023-03-22 09:05:03下载
    积分:1
  • 696518资源总数
  • 105873会员总数
  • 12今日下载