登录
首页 » Java开发 » 文本分类

文本分类

于 2022-05-15 发布 文件大小:369.81 kB
0 149
下载积分: 2 下载次数: 1

代码说明:

1.用seg进行分词    输入参数一:输入文本语料所在的文件夹路径。 如  文本文件语料都放在 train//text 文件夹下,则参数为:train//text//* 。 注意:必须每篇文章在一个txt文本中。   输入参数二:输入存储分词后的结果文件所在的文件夹路径:如:result//text。注意:不需要加*   本工具采用了中科院的中文分词工具,ICTCLAS,请自行到ICTCLAS官网下载该工具。并把Data文件夹,Configure.xml,ICTCLAS30.h,ICTCLAS30.lib,ICTCLAS30.dll放在和seg.exe同文件夹下面。 2.getFeature获取特征:输入参数格式如上。   其输入语料为seg分词的结果。   注意:请把ICTCLAS30.dll放在于getFeature.ext同一个文件夹下面 3.getSVMTtrain转化成libSVM的格式   输入参数1:输入文本语料所在的文件夹路径。 如  文本文件语料都放在 train//text 文件夹下,则参数为:train//text//* 。其输入的文件为getFeature后得到的结果。 请点击左侧文件开始预览 !预览只提供20%的代码片段,完整代码需下载后查看 加载中 侵权举报

下载说明:请别用迅雷下载,失败请重下,重下不扣分!

发表评论

0 个回复

  • resteasy 后台demo
    资源描述 该资源使用java restful风格的应用框架resteasy,实现了jax-rs规范的一个demo,能够输入restful风格的url访问网页
    2022-01-25 21:21:59下载
    积分:1
  • 一个叫Hangman的猜词小游戏
    这是一个基于Java语言下的猜词小游戏 玩家可以猜词库下的随机一个词(词库可以被访网)然后用户开始游戏的时候输入框左边将有一个小人,如果玩家输入词的字母拼写有误小人将一步一步将自己吊死游戏允许玩家输入错误5次 完成一个单词的猜测后可以选择是否进行下一次游戏。                                                                                                                                                 &
    2022-03-20 16:24:42下载
    积分:1
  • 企业人力资源管理系统
    人力资源管理系统(Human Resources Management System,HRMS)包括人事日常事务、薪酬、招聘、培训、考核
    2022-04-17 14:19:22下载
    积分:1
  • Apache Ant
    Apache Ant is a Java library and command-line tool whose mission is to drive processes described in build files as targets and extension points dependent upon each other. The main known usage of Ant is the build of Java applications. Ant supplies a number of built-in tasks allowing to compile, assemble, test and run Java applications. Ant can also be used effectively to build non Java applications, for instance C or C++ applications. More generally, Ant can be used to pilot any type of process which can be described in terms of targets and tasks.
    2023-07-28 21:15:04下载
    积分:1
  • Reprap软件源代码
        RepRap被视为是一个完整的复制系统,而不是简单的一块硬件。为此,该系统包括计算机辅助设计(CAD)的3D建模系统和计算机辅助制造(CAM)软件和驱动程序的形式,把RepRap用户的设计转换成一组指令,通过RepRap的硬件,转变成了物理物体。    已经有为RepRap开发了两种不同的CAM工具链。首先,简单地题为“RepRap Host”,是RepRap领导开发人员Adrian Bowyer用Java语言编写。第二,“Skeinforge”,是由Enrique Perez独立编写。两者都是完整的工具链系统,把3D模型转换为命令打印机的机器语言G-code。 请点击左侧文件开始预览 !预览只提供20%的代码片段,完整代码需下载后查看 加载中 侵权举报
    2023-02-07 09:15:06下载
    积分:1
  • 串口助手
    应用背景有时候做东西,串口接受到数据还要进制转换、线性化等操作,本程序可以自己修改,直接显示计算后的值关键技术串口助手,可二次开发,加入自己的计算公式和显示方式,方便对接受到的串口数据观察和使用
    2023-08-08 03:25:04下载
    积分:1
  • java经典射击飞机游戏
    在java课设上,老师要我们每人做一个课设,我就选设了这个以前非常喜欢的游戏,想揭开它的面纱
    2022-01-21 02:57:04下载
    积分:1
  • 贪婪算法
    这是贪婪算法的实现。 在这里以两种方式解决线切割问题。 一种方法是用第一种拟合方法选择的候选人和另一种是以与最佳拟合方法选择的候选人。 对您的谢意。
    2022-08-12 23:08:21下载
    积分:1
  • hadoop插件
    用于大数据开发技术,在创建项目时可以添加此插件实现对hadoop环境的配置,为更好的理解大数据的开发技术有很大的帮助
    2022-08-25 07:14:08下载
    积分:1
  • 电力规约IEC608705/DNP3 Java源码
    本人从luciol官网下载的一套集成一系列电力规约IEC608705、DNP3协议的java源码框架,而用java编写电力规约本身就很少见,能在网 上找到这套代码实属不易。这套框架已经满足大部分需求,代码精简、易懂,对象关系设计合理,各种规约分类明确,只有IEC104规约没有完善,不过可以参 考IEC101规约源码及设计思路,本人已经做过测试,工具类灵活、可扩展性强,虽然不能直接商用,但确实参考性极强
    2022-03-17 22:55:06下载
    积分:1
  • 696518资源总数
  • 105958会员总数
  • 18今日下载